
麦克风解决方案将发掘交互式机器人的无限潜力
人们不断开发配备智能扬声器等机器人学和人工智能技术的交互式机器人。要实现语音识别(这是交互式机器人的一项关键技术),需要多个复杂且紧凑的麦克风,以便从背景噪声中识别出讲话者的声音。TDK 提供多款超紧凑 MEMS(微电子机械系统1)麦克风,这些麦克风利用先进的半导体微细加工技术,支持语音识别技术的发展和交互式机器人智能的进一步改善。

交互式机器人的语音识别技术问题
代替人类执行操作或辅助人类操作的机器人主要分为工业机器人和商业/服务机器人。近年来,商业/服务机器人快速发展,到 2025 年,预计其全球市场规模将达到 520 亿美元(信息来源:株式会社富士经济“2018 全球机器人相关市场的现况与前景预测”)。在商业/服务机器人中,交互式机器人的发展尤其符合预期。
交互式机器人利用人工智能与人类自动交互。它们可以根据相互交流驱使动作和/或语音,在解决全球社会问题(如老龄化社会和劳动力短缺)方面预计将发挥作用。
商业/服务机器人的全球市场规模

基于株式会社富士经济“2018 全球机器人相关市场的现况与前景预测”创建。
交互式机器人的用户界面由语音识别技术提供。交互式机器人需要检测讲话者的方向(即使他/她在远处讲话)并在背景噪声中识别他/她的话语。解决方案是安装多个麦克风,以便根据到达时间的差异和各麦克风接收到的语音强度差异来辨别讲话者的方向。这一技术被称为波束成型。此外,需要使用多个麦克风,通过噪声消除技术2仅从来自各个方向的背景噪声中消除噪声成分。
要实现波束成型和噪声消除,需要使用多个尽可能紧凑和轻便的麦克风。另一方面,要准确识别讲话者的声音,需要高信噪比3。然而,一般而言,信噪比越高,动态范围4就越大。交互式机器人的麦克风面临一大挑战:如何在保持紧凑、轻便的同时维持高信噪比并抑制失真。
利用紧凑型 MEMS 麦克风的语音识别技术解决方案
TDK 的各款 MEMS 麦克风解决了波束成型和噪声消除的问题。TDK 以 InvenSense 品牌推出的 ICS-40730 是一款紧凑的高性能 MEMS 麦克风。尺寸为 4.72 x 3.76 x 3.50 mm,信噪比高达 74 dBA,适合用于波束成型的麦克风阵列5。即使在 105 dB 的声级,ICS-40730 也能够以 0.6% 抑制失真,从而维持高信噪比。(110 dB 的声级即被视为噪声,如火车通过时高架铁轨下方的噪声水平。)该款麦克风对噪声消除功能也有大有帮助。
使用 MEMS 麦克风阵列实现波束成型的示例

除了 ICS-40730,TDK 提供适合各种应用的 MEMS 麦克风系列。TDK 的麦克风用于智能手机、笔记本电脑、平板电脑、可穿戴设备、助听器以及交互式机器人和豪华汽车中配备的语音识别接口。这些麦克风包含 MEMS 组件,它们是集 MEMS 技术 — TDK 的核心技术 — 和 ASIC(专用集成电路)于一体的声传感器。
适用于机器人车辆的 MEMS 麦克风

机器人不断进化,与人类越来越相似。仿人机器人配备大量用于控制关节和姿势的传感器,从而实现似人类的动作。除了 MEMS 麦克风和各种其他 MEMS 传感器,TDK 还提供多种传感器(如利用半导体技术、薄膜技术和磁技术的角度/位置传感器、利用电子陶瓷技术的温度/压力传感器)与先进软件,从而支持机器人学的发展。
TDK 的传感器集成到仿人机器人中

MEMS 麦克风“ICS-40730”

术语
- MEMS 是微机械加工技术,可利用与半导体集成电路类似的制造工艺,在硅基底上制造优质传感器以及可移动机制等。
- 噪声消除技术通过在噪声波中添加反相声波,仅消除噪声成分。该技术应用于头戴式耳机和智能手机等。
- 信噪比是指信号功率与噪声功率之比,以对数方式计算。比率越高,噪声就越小,信号质量也越高。
- 动态范围是指噪底与非线性失真开始处之间的距离。这定义了麦克风 SPL 中的可用范围。
- 阵列由多个部分组成,主要用于致密化。