很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
撰稿:贾宁 编辑:李君宇
1970年代半导体、1990年代个人电脑、2000年互联网……有人认为人工智能将有可能成为第四波革命浪潮,大数据、云计算、深度学习等技术的成熟、资本源源不断的投入繁荣了一批又一批人工智能企业。
2007年,起源于英国剑桥的思必驰杀入语音识别和对话系统领域,希望创造类似于汉语老师的智能PC终端来帮助老外学汉语,市场小、时机未到、技术不成熟等原因让这个项目遭遇寒冬。 思必驰转向教中国人说英语的项目,最终得以生存。
2012年,移动互联网兴起,Siri的横空出世让思必驰创始人兼CEO高始兴看到了语音交互在移动互联网乃至智能硬件、物联网的未来。剥离英语教育这块业务后,思必驰专注物联网。
现在,思必驰已经拥有了300多名员工和100余个发明专利,合作客户近20000家,包括阿里、京东、腾讯、联想、小米等互联网巨头,估值数十亿元。
从寒冬等到人工智能春暖花开,高始兴坚守了整整10年。
▲思必驰创始人兼CEO高始兴
01 产学研一体,打造核心竞争力
2006年,在英国剑桥大学商学院读硕士的高始兴与同在剑桥读语音识别方向博士的俞凯(现思必驰联合创始人兼首席科学家)同住在休斯学院,两人经常一块吃饭、打乒乓球、谈天说地。
恰同学少年,风华正茂。彼时剑桥大学创业氛围浓郁,从实验室走出来的科技公司数不胜数。在大学时代有过创业经历的高始兴,跟随导师参与过产学研转化的俞凯,两人对创业跃跃欲试,一拍即合。
2007年,同为剑桥毕业生的林远东,放弃BSI中国区首代职位加入创始团队。当时的方向是为教育领域提供语音技术服务。
当时几人凑了几百万元,博士毕业后的俞凯,把大部分工资也投入了其中,「2007到2011年是一个特别痛苦的时间,现在语音人才一人难求,但是那时候找不到高薪工作,大部分都转做金融了。」
俞凯是少数坚守下来的人。他前五年做语音识别,后五年做对话系统,为思必驰的底层技术打下基础。他选择的方式也始终如一,从剑桥到上海交通大学,他一直在院校科研的第一线。
「人工智能方向的公司一定需要有基础研发的能力,技术的更新迭代是非常快的,要做技术驱动型平台企业的话,需要底层有自己一套基础的东西,能够源源不断地产出新概念、新算法、新人才。」俞凯说。
俞凯在剑桥与英国皇家工程院院士Steve Young教授、机器智能实验室主任Phil Woodland教授都有过合作。Steve Young又做研究又创业,1999年,他将创业公司Entropic出售给了微软。而2010年,谷歌收购了他的另一家创业公司Phonetic Arts。2015年,苹果收购了他创立的语音人工智能公司VocalIQ。
从俞凯2012年回国在上海交大任教以来,最早以项目合同的形式进行技术产出,后来成立了思必驰—上海交大联合实验室,规模不断扩大。
俞凯认为,思必驰在语音识别、语音合成、对话系统、软硬件结合拥有技术优势。他举例说,在国际抗噪语音识别测试上,思必驰两次获得单系统识别的最佳结果。2017年思必驰尝试多系统,在研究层面错误率做到了3%,而人的错误率是百分之二点几。
在语音合成上,思必驰采用参数化统一模型合成语音,用一个公式去描述声音的生成,自由定制多种合成音,不单让语音清晰,而且让语音有个性和独特的表现力。
作为一家专注智能硬件语音交互技术的公司,思必驰看重在软硬结合上的落地能力,将软件算法与硬件模组结合在一起,提供一整套解决方案,包括传感器、麦克风、声学结构设计等硬件模组的设计。
虽然深度学习+大数据是人工智能的标配,但是俞凯认为炒得火热的深度学习,也已经到达了临界点。许多公司都开源了自己的深度学习软件,比如Google的TensorFlow,在深度学习上已经「搞不出什么花儿」。
「传统深度学习加大数据已经不行了,人工智能算法更新很快,它会结合你的知识、你的规则、以前机器学习的方式,迭代出下一代新的东西,超越一般意义的深度学习。它螺旋式上升,有迁移学习,我自己提出的闭环学习、知识嵌入等等,是以后新的算法当中需要加入的元素。」俞凯说。
02 深耕垂直领域,广铺开发者平台
2014年,移动互联网正在爆发,智能硬件、物联网也成热门领域。思必驰开始思考能不能在下一代的物联网市场里分一杯羹。为了保持创业公司的专注,这一年,思必驰将原来运营良好的教育事业部从公司剥离,成立新的公司苏州驰声信息科技有限公司,林远东担任CEO。思必驰本身则专注智能硬件、物联网行业。
移动互联网的载体是手机,用户习惯于手机的图形交互界面,但是未来没有显示器的设备会越来越多,语音是跟这类设备沟通的绝佳方式,loT车载事业部总经理张岩认为,语音交互会是即将现象级爆发的窗口。
对于智能硬件领域来说,产品形态与人机交互技术的结合非常重要。车载场景里的HUD(Head Up Display抬头平视显示器),它在当时的形势下是能够承载语音交互非常好的载体。
车萝卜(Carrobot)是思必驰的第一次试水。这一款智能车载机器人,通过放置在方向盘正前方仪表台上的HUD透明投影屏展现信息,并通过语音人机交互实现语音导航、接打电话、收发微信、听歌点歌等功能。
思必驰副总裁雷雄国从2009年就跟随高始兴,是技术、评测、市场、商务的多面手。2014年,他被派到深圳——车载市场的最前线进行考察和调研。
车载市场分为后装跟前装,前装指汽车在整机厂时预先安装的电子设备产品,后装则是汽车用户后续购买的电子设备产品。深圳及周边区域占了全国车载市场产能的90%,数百厂家驻扎于此,是智能语音技术公司必争之地。
早期的攻坚尤为艰难,有时候连老板也见不到,见到了老板,结果老板说我已经见过科大讯飞的人了。后装不同于前装,一旦出现质量问题,终端消费者可以直接退货,用户体验和后续服务成为了谈判的关键,雷雄国从价格、支持力度、后续服务三个方面说服客户。
「车载时的各种噪音环境里,我们语音识别的准确率是最高的。当时我们在深圳成立了专门的团队,出现什么问题,他打个电话我们会马上过来调试,我们竞争对手的响应速度跟不上,所以服务还是非常关键的。」 雷雄国说。
与百度和科大讯飞在后装市场的免费策略不同,思必驰在商务策略上采取收费策略,硬件和服务收费,授权也收费,即要用思必驰的语音技术,必须付一笔钱,思必驰才做技术服务支持。
「这个主要不在于钱,主要是在于高品质客户的选择,这些客户既然愿意给钱,他肯定是全心全意想把这个事做好。」雷雄国说。
思必驰从后装市场入手,拿下智能后视镜大部分客户。随着智能车机兴起,智能后视镜市场份额下降,从2016年6月,思必驰用一年时间又拿下智能车机中控。根据思必驰提供的数据,目前思必驰在国内后装市场,占有率60%以上。
雷雄国在深圳牢牢扎根下来,深圳也成为了思必驰的第二个大本营,发展成为一百多人、技术销售相对独立的IOT车载事业部。「市场在哪儿,我们的发力点就在哪。」张岩总结。下一步,思必驰计划从后装打入前装,与在前装市场盘踞已久的科大讯飞正面交锋。
时值亚马逊Echo和Alexa风头正盛。国内大家纷纷跟风前沿技术,一时间,大大小小的语音开放平台不断涌现。思必驰也在做相关的尝试,一方面继续深耕车载、家居和机器人等垂直领域,另一方面开始酝酿自己的开发者平台,将服务铺开,将工程师解放出来。
思必驰在2013年就推出了人机对话平台,但在当时在移动互联网是弱需求,故而有了后来向智能硬件刚需市场转移的策略。现在,随着行业的发展,新的爆发节点来临,思必驰这才带着之前的技术和经验积累,重返开发者平台。
2016年年底,高始兴找来前乐视语音CEO赵恒艺,由他负责思必驰DUI开发者平台。
DUI开发者平台做的是全链路的定制,包括语音识别、语言模型、语义解析、多人对话管理、自然语音生成以及语音合成的全定制,而定制的过程非常简单,大部分不需要编程,在UI界面点一下发布,就可以在客户端直接更新资源、自动匹配。
DUI平台原本计划一年左右推出,赵恒艺认为可以在上面投入更多力量,开发时间压缩到半年。
2017年春节前,赵恒艺花了一个多月时间做出了一个完整的产品规划图。他把半年时间按照每两周一个迭代单元进行划分,5月31日推出阿尔法版本,6月底推出可内测版本,七月进行打磨和BUG修复,八月底正式推出。
计划的前两周,是整个研发过程中相当难的一部分,赵恒艺把它放在开头是有原因的。「第一个Sprint(两周的迭代单元)做的工作,这相当于我们的第一个战役,一定要打赢,为之后开一个好头。大家为这个目标所做的各种磨合,又能建立起深刻的战斗友谊和信任感。」
首战必胜,然后不断积累小胜利,高昂的士气让团队遇到困难时也迎头而上。
在遇到GUI(Graphical User Interface图像交互)跟VUI(Voice User Interface音交互)结合的难题时,他们团队输出了一个概念叫DUI(Dialogue User Interface 对话交互),让语音交互的定制在一个可视化空间里面去完成。当时这个难题的工作量已经膨胀了好几倍,到了让大家受不了的程度,整个前端团队有一段时间是天天凌晨两三点下班,最后还是保质保量地完成了。
过去大客户一整套的定制内容非常多,对甲方和乙方都是沉重的负担。如果所有的事情都交给乙方去做的话,一方面开发的过程会非常冗长,另一方面很多时候甲方没办法参与一线开发工作,只能通过口头或者文档表达。大客户本身有一定的研发能力,思必驰开放定制权限后,客户可以亲自参与并且快速反馈和迭代,马上就可以在自家产品里看到用户体验的效果。
从推出到产品正式上线,还有很长的路要走。目前思必驰采取一对一的市场推广策略,从5000位报名用户中筛选出200人发出内测邀请,通过电话沟通、现场参观等流程再选出真正能提升内测体验的50位用户,确保在产品正式发布前,搜集的情报和建议能够有效地提升宣传推广的转化率。
「我们自己的孩子,怎么看都是美的。但真的要把女儿送出门的时候,你还是要请专业的设计师团队帮她打造。」思必驰CMO龙梦竹说。
对于过去依靠授权和大客户定制模式获得收益的思必驰来说,DUI开发者平台也会带来新的商业化探索。
03 既是创业公司,也是产业投资人
2011年公司快揭不开锅,账面上的钱只够花几个月,高始兴和林远东抵押了自己的房子。融资的需求,第一次摆在了桌面上。恰逢Siri问世,语音交互不再是虚无缥缈的东西,投资人也开始尝试。
2012年初,思必驰获得了第一轮融资,联想之星、启迪创投和剑桥校友三方联投,金额数千万元。「市场的曙光初现。」高始兴终于触碰到资本的温暖。
2014年,又一次资金危机,高始兴与俞凯再次抵押了房产。这时,阿里巴巴来到思必驰面前。2015年底,阿里巴巴上亿元的投资到账。
蜜月期还在继续,2016年夏天,阿里巴巴领投的C轮融资到账,金额近2亿元。
这是一次双向选择。未来移动互联网生态向物联网迁移,思必驰需要打通后端进行内容和服务的整合。对于阿里巴巴来说,思必驰可以帮助它实现服务落地到端。
「现在这个世界,不是A的就是T的,但是未来会越来越开放。在物联网人工智能的新时代,这个世界不再就是A的、就是T的、就是B的,而是一定会出现新的。」高始兴说。
▲(制图:彭瑞)
思必驰副总裁郭浩然在此时加入,全面接手思必驰的资本事宜。他和高始兴在一些远期目标上,有共同的看法:打造一个物联网大生态,只靠思必驰一个人单打独斗是不行的。一方面,思必驰积极与大型互联网公司开展内容和渠道上的合作,另一方面,思必驰希望通过资本的战略布局来构建自己的物联网生态。
思必驰开始了创业公司与天使投资人的双重身份。「我去融资,要到钱人家会说你这个估值太高了,我给别人投钱,也会说你这个估值太高了。这确实是一个两难。恰恰是这样,我们更能和投资人、被投企业保持良好的关系,因为能站在对方的角度去思考和理解。」郭浩然说。
目前思必驰有两支基金,一支是自己的天使基金,另一支是和其他投资机构合作的成长基金,「产业与资本的结合,也是这个行业的趋势。」
思必驰的投资大赛道有三条,第一个是DUI、VUI,智能交互的赛道;第二个,物联网IoT;第三,AI的一些垂直应用。
从汉语教育、移动互联网、物联网,再到现在的产业投资,思必驰探索的十年也是人工智能翻天覆地的十年。近五年的中国新增人工智能企业数占全国人工智能企业总数的72.71%。寒冬过后,即将迎来万花争艳的春天。
「围绕物联网产生的人工智能公司会很多,但是未来,能够在市场起到主导作用的只有那么几家,我相信,思必驰一定会是其中之一。」高始兴说。
延伸阅读
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)