1. 首页 > 生活百科

从专利视角看语音识别产业的趋势和风险 专利重视

作者:admin 更新时间:2025-09-06
摘要:前几日,麻省理工学院(MIT)主办的科技期刊《麻省理工科技评论》公布了2016年十大突破技术,语音识别和自然语言理解相结合的语音接口技术名列榜单。语音识别作为未来人机交互,即人工智能领域的一个入口,自然一直备受关注,国内外语音识别产业的竞争也是愈演愈烈。无论是语音识别行业的传统贵族Nuance,还是..." />

前几日,麻省理工学院(MIT)主办的科技期刊《麻省理工科技点评》公开了2024年十大突破技术,语音识别和天然语言领会相结合的语音接口技术名列榜单。语音识别作为未来人机交互,即人工智能领域的壹个入口,天然一直非常被认可,国内外语音识别产业的竞争也是愈演愈烈。无论是语音识别行业的传统贵族Nuance,还是后起之秀微软、苹果、谷歌、Facebook等,抑或是国内的度娘,科大讯飞,思必驰等企业都在加速语音识别行业的布局。

然而,在当今的激烈市场竞争中,专利早已经成为企业竞争的一柄利剑。过去的2024年,中国民族姿势产权局共受理发明专利申请110.2万件,同比增长18.7%,这已经是我国第5个年头专利受理量居全球首位。也许很多时候姿势产权的价格还不能直接体现,然而其在进步企业效益,抢占市场,保持企业可持续进步的能力却不可小觑,特别是在抢占国内市场,竞争国际市场中。不仅如此,专利作为企业不得不给公众透露以获取独占权的决定因素信息,对其进行详细、周密、综合的解析,可以从中获取巨大的商业价格。今天,大家也简单的从专利视角来解析一下语音识别产业。

 

从专利申请量分布看语音识别产业的整体进步动向 

1952年贝尔实验室Davis等人研究实现了第壹个可识别十个英文数字的语音识别体系——Audry,开始了语音识别研究的进步时代。中国的语音识别研究也是始于20世纪50年代的,中国科学院声学研究所利用电子管电路所搭建了国内第壹个可识别10个元音的语音识别体系。语音识别的初期研究进展都是缓慢的,大规模的语音识别研究都是在70、80年代后,才取得了实质性的进展。

 

从ISI Derwent Innovations Index数据库平台收录的自1963以来全全球40多个专利机构的基本发明的数据来看,语音识别的相关专利共计有17792件。其中,1963年至1970年间,并没有语音识别方面的相关专利申请;从70年代开始,语音识别方面才陆续接受到了相关的专利申请,1970-1990年间,共计有881件相关的专利申请,这段时刻主要是相关突破性技术的攻关期;进入90年代后,语音识别体系逐渐从实验室走给应用,语音识别方面的相关专利也进入了井喷时期,1990-2010年间,共计有12817件相关专利申请,专利的技术动向也开始走给了实用,并迅速进入了产业化阶段;2010年后,语音识别的核心技术不断突破,逐渐进入相对成熟的阶段,逐年的专利申请量在千件以上,并维持稳态进步。

笔者认为这一动向预示着:语音识别技术已经进入壹个相对稳定成熟的情形,其作为人工智能入口的突破点正给着天然语言处理方面深入,而语音识别和产业化结合所衍生的一系列应用,正在迅速的进行验证和实现。也就是说,依托云计算、网络技术、硬件性能的迅速进步,以及深度进修,神经网络等学说进一步深入,已经极大的进步了语音识别技术的可用性和准确度,语音识别在人机交互中“听清楚”的任务已经基本完成,下一步的技术的突破应该会集中到“听得懂”方面,如果仍然在语音识别的阶段投入过多的精力和资源,提高和回报的空间将会特别有限。

 

我国的语音识别产业和全球语音识别产业进步基本上是保持同步的态势。根据CNKI自1985年收录的中国专利的数据来检索决定因素词语音识别,可以发现2000年前在中国申请的有关语音识别的专利累计157件,2000年后也出现了良好的增长态势,专利申请总量超过1000件,而2012年后,语音识别技术方面的专利申请量又实现了快速的进步,平均每年在500件申请量左右。这也表明:在语音识别的市场竞争中,国内的企业正在抓住机遇,紧密布局,积极应对,以期望在这场技术的博弈中赢得话术权,争得一席之地。

此基础上,横给观察整个人工智能的入口,目前的技术动向虽然语音识别仍然占整体专利布局的半壁江山,然而手势及体感和面部的方面的相关专利申请量也悄然上升。这是否意味着未来的人工智能,或者说人机交互方法不仅仅是语音入口,也许会是一种最新的方法?

从专利分布情况看语音识别产业的潜在风险

众所周知,语音识别是一门交叉学科,其所涉及的领域特别广泛。从ISI Derwent Innovations Index数据库平台收录的数据看其IPC号分布,语音识别涉及领域是特别广泛的。涉及的技术主要包括人工智能、信号处理、玩法识别、概率论和信息论、发声机理和听觉机理、神经网络等。涵盖的领域包括语音输入、语音辨识、语音翻译、语音控制等,渗透到工业、家居、通信、消费电子、汽车电子、医疗健壮、家庭服务、交通运输等多个应用领域。中国专利申请中的语音识别专利其覆盖的范围主要集中在语音解析或合成、语音识别、语音处理、语音以及音频的编解码(G10L),电数字数据处理(G06F),电话通信(H04M),这三个领域专利累积比例高达80%。从覆盖的领域范围中,可以解析出未来语音识别的应用将会主要集中在利用语音识别输入代替传统的人机交互方法,并通过人机智能对话来提高用户尝试,协助用户进行决策中,以及语音通信,通过声音对电子产品进行操作控制,如智能家居、汽车、玩具、控制仪器等。

 

除了覆盖的领域,从语音识别专利的分布情况中,大家还要来看一下最为重要的权利人的分布状况。以ISI Derwent Innovations Index数据库检索语音识别专利的结局来看,累积专利申请量方面,前五位为IBM,NEC,微软,Nuance和东芝,分别为749件,508件,506件,415件,406件。而从近五年语音识别专利的申请量来看,除了IBM被Google替代,降至第7名,其他几位仍然保有专利数量的优势,排行顺序是Nuance,谷歌,微软,东芝,NEC,分别为206件,178件,141件,102件。证明巨头形成的专利防御攻势仍然迅猛,而大家所关心的后起之秀也来势汹汹,2010-2024年,苹果布局专利25件、亚马逊布局专利33件。而中国的语音识别企业专利布局还主要是在国内,国际领域的专利布局情况和国外企业对比,确实还存在巨大差距,因此未来国内语音识别产业进军国际市场恐怕会遇到一些小未知。

 

接下来,大家再看一下国内语音识别产业总体的专利分布情况。从不同民族在华申请的专利数量来看,中国申请人仍占主导,约占总量的75%,其次是美国申请人,约占总量的13%、再次就是日本和韩国申请人,约占11%。

从国内语音识别专利的专利权人来看,国内企业的专利布局还不具有突出的优势。排行前5的国外专利权人是微软,三星,IBM,松下和三菱,当然这多少国际电子巨头在技术上有较强的研发实力,天然占据了较大的申请量。从时刻方面来观察,微软和三星的语音识别专利呈上升动向,IBM和三菱呈下降动向,而松下则相对稳步持平。国内专利权人来看,主要是华为、中科院声学所和自动化所、清华大学、科大讯飞和联想在数量上占有优势,其中,华为的语音识别技术主要是在移动通信领域,清华大学主要是针对汽车电器的语音识别控制方法。而国内的语音识别的后起之秀,如度娘等,在近几年的专利申请上也呈现出赶超爆发的动向。

 

以上大家可以看出,国内的语音识别技术具备一定基础,技术实力也旗鼓等于,然而专利数量和专利布局方面略落后于国外企业。不过,从国内企业专利申请量的增长动向来看,加之国内语音识别领域也涌现了越来越多的新兴力量,随着竞争日趋激烈,和国外企业的差距会不断缩小。在竞争和制衡中,专利是重要的筹码,国内企业要在国外企业完成在华语音识别领域布局前,构建起有效的专利保护屏障以及专利预警的机制,才会拿到语音识别领域的话术权,避开潜在风险。