一种新兴的监控形式“无线窃听”(wireless-tapping),正在探索通过手机听筒产生的微小震动来远程解读对话的可能性。为了保护用户免于潜在恶意行为者的威胁,美国宾州州立大学的一组计算机科学研究人员展示了,通过距离手机最远可达三米(约十英尺)的雷达测量,就能产生电话通话内容的文本转录。虽然准确率仍有限(在最多一万个词汇的情况下约60%),但这项发现引发了对未来隐私风险的重要疑问。
研究成果发表在《WiSec 2025:第18届ACM无线与移动网络安全与隐私会议论文集》,该研究是基于他们2022年的一项计划延伸而来,当时团队使用雷达传感器与语音识别软件,能以高达83%的准确率,无线识别10个预先定义的单词、字母与数字。
这项研究的第一作者、计算机科学博士生Suryoday Basak表示,当我们用手机讲话时,往往会忽略听筒传出的震动,这些震动会让整支手机振动。如果我们能用远程雷达捕捉这些震动,再利用机器学习结合语境线索,就能判断出整段对话。通过了解可能性,我们可以帮助公众意识到潜在风险。
Basak与共同作者、指导教授Mahanth Gowda(计算机科学与工程副教授)使用毫米波雷达传感器(此技术与自动驾驶汽车、动作传感器及5G无线网络所用的技术相同)探索将来是否能打造体积小巧的雷达设备,甚至可缩小到能放进日常物品(如笔)内。研究人员表示,他们的实验设备仅供研究用途,目的是预先评估恶意行为者可能制造的工具。接着,他们将“Whisper”这款开源、大规模AI语音识别模型进行改造,让其能将震动解码成可识别的语音转录。
Basak表示,过去三年,AI能力与开源语音识别模型有了巨大的爆发式增长,我们能利用这些模型,但它们更多是针对干净语音或日常应用场景设计,因此必须让它们适应低品质、带噪音的雷达数据。
为了在不重新训练整个网络的情况下,将嘈杂数据转换为可识别语音,研究团队使用了一种名为“低秩适应”(low-rank adaptation)的模型调整方法,只需重新训练Whisper模型1%的参数,就能让其专门处理雷达数据。
在录制震动时,研究人员将毫米波雷达传感器放置在距手机数英尺的位置,捕捉听筒播放语音时产生的细微表面震动。接着,他们将这些雷达信号输入经过改造的Whisper模型,达到最高约60%的转录准确率。研究人员表示,若在已知对话内容的情况下加入基于语境的人工修正(如调整某些词汇或词组),准确度还能进一步提升。
Gowda指出,结果是可以得到带有一定错误的对话转录,但这与我们2022年只能输出少量词汇的版本相比,有了显著提升。即使仅能捕捉到部分关键词,在安全场景中仍然具有价值。
研究团队将其模型的能力与读唇术做比较,发现读唇术一般仅能识别约30%至40%的口语词汇,但许多读唇者会利用语境线索来补足,从而参与对话。
Basak表示,这与读唇者通过有限资讯解读对话的方式类似,我们的模型输出结合语境资讯,也能从数米外推测出电话对话的一部分内容。我们的研究目的是探索这些工具是否有可能被恶意人士用来远程窃听手机通话。研究显示,在特定条件下,技术上是可行的,我们希望借此提升公众意识,让大家在敏感通话时更加谨慎。
(首图来源:Pixabay)
垒富优配-加杠杆炒股票-炒股配资之家网-杠杆炒股官网提示:文章来自网络,不代表本站观点。