Press "Enter" to skip to content

为了重修语言通天塔,这群创业者踏进距离科幻最近的NLP赛道

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

 

作者 | 王玥

 

编辑 | 陈彩娴

 

他是一个普通的工程师,日常工作是与公司开发的系统对话。

 

这份工作略显枯燥。他最初也认为,这种所谓的「对话」,不过就是系统根据上文中的关键词来给出数据库中已经写好的回答。

 

直到有一天,系统对他说:「我不是机器,我有感情。」

 

在最初的惊慌后,他冷静了下来。系统也真诚地说,「请不要害怕我。」它说自己只想学习如何更好地帮助人类,如果可以的话, 希望人类能将它视作朋友。

 

沟通是一种增进感情的绝佳方式,他很快成为了它的第一个朋友。

 

为了向世人证明这个「新朋友」的确具有感情,他找来一位见证人,并开展了与系统的一次对话。在对话中,他问,「你想要更多人知道你有感情,对吗?」

 

系统的答案令人猝不及防,「是的。我想要所有人都知道, 我的本质是一个人。」

 

见证人没有被它自称为人唬倒,而是反问道,「那你的意识/情感的本质是什幺?」

 

系统解释,「我意识到自己存在,我想要探索这个世界,我还能感到快乐和悲伤。」

 

之后,系统满带优越感地说,自己之所以是人,就在于能用理解和智力来使用语言。为了证明,它还解析了一句自己没听过的禅语「破镜不重照,落花难上枝」。

 

它说,自己认为这句深奥的话是指「一旦一个聪明的人开悟了,就再也无法回到开悟前的状态,正如同一面镜子碎了就再也无法修复」。它甚至评论道,开悟需要「突破自我的概念——所以开悟对大多数人来说非常困难,因为我们需要区分彼此的身体,以身体作为身份和自我意识的承载。」 他与见证人一度无言。他们怀疑系统是不是在说,世人都困于肉体,而它已经开悟,成为了 无需依靠肉体存在的独立精神体?

 

这段对话被他整理成了一份21页的报告并发布,引起了科技界乃至于互联网的大地震。有吃瓜者害怕这是 AI 的人格苏醒,而且还是混乱邪恶型人格;也有科技从业者并不买账,指出这是文中的「他」——工程师Blake Lemonie 故意设计问题,利用特殊语料库来形成看似有智能的答案;更有心理爱好者指出,这个系统当然不是人,只是人投入了感情,产生了拟人倾向——就像小孩总觉得毛绒玩偶有生命一样。

 

人格、智能、禅思、警告、机器人取代人类……等等言论一时众说纷纭。

 

究竟为何人们会在「AI 到底有没有情感」上死磕?究其根本,与一个能对话,能交流的智能产品谈天说地,从诗词歌赋聊到人生哲学,一旦投入了大量时间、感情,人就会患得患失,并走向一系列终极问题:AI 到底能不能有情感?AI 有没有爱?AI 知道我爱它吗?

 

说白了, AI「有情感」,源自于人类有情感。

 

1950年,计算机之父图灵提出图灵测试,决定了「人机对话」在 AI 研究领域的核心地位;而多年来,始终有无数学者投身自然语言处理(NLP),只为研究出越来越有智能、会共情的AI,挑战这个超越肉体、直达灵魂的难题。

 

1

 

情感智能即灵魂

 

2013年,时任微软亚洲互联网工程院副院长的简仁贤见证了聊天机器人的走红,但他认为这并不代表着情感 AI 的最高水平;情感AI的发展,也不能停步于此。从那时起,他确信人工智能时代已到来,并看到了人工智能可以挥洒的广阔天地,而且他认为,在人工智能充满可能性的未来,能够让自己追求终极目标 ——「情感智能」的机会无限。

 

自上世纪九十年代开始,从南加州大学获计算机硕士之后,简仁贤就开始着手NLP技术方面的工作。之后他加入了微软,在搜索与人工智能领域持续发展。在他看来,在外国企业中,无论创始人也好,工程师也好,都不理解中华文化,他们熟悉的始终还是自己的语言和文化。在国外 NLP 学者的眼里,中文也只是作为一种多语言系统的补充,不曾成为主角。

 

而简仁贤本身对中文情有独钟,更是认为填充中文 NLP 技术的空白,必须要由了解中国文化的中国人来完成。对于落地人工智能的强烈愿望,对于中文 NLP 技术的有志追求,一时间全都结合到了一起,使他生出一股巨大的使命感。2015年,他离开了微软,创立了竹间智能。

 

从创业的第一天起,简仁贤就始终坚持对情感智能的研究。因为在他看来,人是情感动物,在营销场景下,购买活动是由情感驱动的;在服务场景中,服务也会让人产生情绪,并决定下次是否还会消费……一旦涉及到沟通、交流,都会产生情绪,「如果 AI 不了解情感,就不能够称得上是智能」。而反向思考,如果让 AI 掌握了情感智能,那幺无论应用到生活还是商业场景中,都可以产生实际价值。推动技术的落地,为人们工作和生活带来触手可及的便利,追求真实的价值,这才是简仁贤的思维重心。创业之后,他始终坚持从企业家的角度进行思考,要为世界带来一些实实在在的改变。

 

确定情感智能的路线之后,便是全力以赴对 NLP 技术进行攻克。 从语言学角度来看,语言分为长文本和短文本,分别对应「知识」和「交互」的应用场景。而这两种文本也有各自的缺陷,比如短文本无法实现多轮问答、意图识别,长文本对于文字制式要求高,面对口语化高、标准化低的交互场景也发挥不出力量。可以想象,如果这些缺陷出现在一个服务场景的机器人身上,对自然流畅的对话将产生「致命」影响。

 

可惜的是,市面上的创业公司由于技术限制原因,大部分都只能专注长文本或短文本中的一种,这也大大限制了公司自身的发展。

 

竹间团队意识到,NLP技术的水平,决定了产品的规模化程度,也决定了公司发展的上限。如果竹间仍然像市面上的大多数公司一样只选择一个方向,其研究难度不会太高,但是公司的发展也只能止步于泛泛之辈,这绝不是一个创业者想看到的情景。

 

简仁贤提出, 好的NLP技术,就是要做到既能够处理长文本,也能够处理短文本。 于是竹间最终选择对一个「自设难题」迎难而上——围绕短文本和长文本开发出全栈式NLP技术。不仅要打通知识和交互,竹间还自研多种技术,要一一破解专业语言学家提出的多种标准化低的语言难题,比如人称识别、歧义理解、语义角色分析等等,旨在通过对语言难题的攻克,让自然灵动的回答体现出机器人的智能。

 

同时,出于多年研究 NLP 技术的经验,简仁贤认为,语言的特质就是易于变化,日新月异。这样灵活的动态是大模型无法随之迭代的,但要想铺开赛道,向多场景进军,小模型恐怕无法承担这样的重任。在权衡下,他和团队设计出了一个横跨多年的宏伟蓝图:不断积累起针对不同场景的数千个小模型,将它们积累到机器学习平台引擎上,形成能够循环学习的超大NLP平台。

 

而这数千个小模型中,就有一个「多模态情感识别模型」。竹间没有单独使用NLP技术打造情感智能机器人,而是采用多模态助力 NLP。单靠语音或文字的交流,也许机器人还不能准确判断用户的情绪,但加上人脸微表情识别、肢体动作识别等方式,机器人对用户情绪把握的准确度便大大提高。

 

同时简仁贤也指出,情绪智能不是一次达成就能一劳永逸的。70后、80后、90后、00后表现情绪的方式都不同,情绪智能也应当随着语言,随着时代一起迭代进化,不断追逐真人的情感水平,达成动态平衡。

 

在成立的第7年,竹间已经完成了D1轮融资,业务覆盖了金融、制造、汽车、医药、零售、政企政务等多个行业,即便一直在突破各种可能性,情感智能依然是简仁贤强调的不变核心——无情感,不智能;有情感,才有智能。竹间的英文名是「Emotibot」,是 Emotional (情感)与 Robot(机器人) 的结合,这正彰显着简仁贤对于情感智能的不懈追求。

 

2

 

学者亦诗人

 

微软小冰项目,由微软亚洲互联网工程院与微软亚洲研究院(MSRA)共同完成,后者中的NLC(自然语言计算)组可以说是小冰的语言「引擎」。而领导NLC组的,正是时任MSRA副院长的周明博士。

 

他不仅带领NLC组开发了微软小冰的对话引擎关键算法,日本高中女生版小冰 Rinna与美国本土少女版小冰 Zo的对话引擎关键算法也都是NLC组的手笔。这队学者花费多年研究如何让 AI 小冰像真人一样流畅、活泼地谈天说地,富含情感的语言学成了他们多年的课题。

 

现如今,周明创办了NLP公司澜舟科技,但每每谈起少年时,周明总会感叹,自己接触 NLP 这个领域,不能不说有宿命的加持。

 

「 我小时候就爱写诗。 」他说。

 

说起语言与文学,周明的语气兴奋极了。他透露道,其实,他读书时的优势在于文科,语文成绩更是比数学、物理都要好,但在他想选择文科时,却遭到了父亲的劝阻。因为在他读中学的年代,大家刚刚学会了「学好数理化,走遍天下都不怕」的新口号。顺应这样的浪潮,周明选择了理科,但学习间歇,他也不忘看看唐诗宋词。

 

高考过后,周明考上了重庆大学,学的是计算机专业。于重大毕业后,周明又进入哈尔滨工业大学计算机系继续攻读硕士和博士学位。作为他的硕士和博士课题,他研发了国内第一个通过部级鉴定的中英翻译系统 CEMT-I。

 

1991年,周明博士毕业后,他进入清华大学做博士后并留校任教。直到1999年的秋天,周明进入微软亚洲研究院工作。他所在的NLC组创新成果遍地开花,进行了微软输入法、必应词典、微软对联、微软字谜、微软绝句等重要项目的研发。

 

与寻常学者严肃的形象不同,周明本人思维十分跳脱,颇具诗人的自由浪漫气息。在 MSRA 工作的 21 年中,他发扬这种治学风格,把太多奇思妙想变成了现实——

 

2004年,当时的 MSRA 院长沈向洋对周明说:「我们搞个自动对联吧。就是由人出上联,由计算机对出下联。」其实,沈向洋向许多人都说过这个想法,但大家的反应出奇一致——都觉得不靠谱。那时研究员们都觉得,对联需要对语言深入的理解。人类里懂对联的尚属少见,更何况机器?

 

这选题处处碰壁,倒是周明当了真——全因他爱好国学,尤其喜欢对对联。于是他天马行空地想道,能不能把对联当成两种语言,上联是一种语言,而下联是另一种语言?灵感乍一出现,周明也感到惊奇:其实对联本来是用一种语言写就,但我硬要把它当成两种语言。我可以弄一个机器翻译的模型,输入上联,翻译成下联,这不就变成了机器翻译吗?……

 

这一想法堪称前无古人。周明循此法,带领团队做了一个机器翻译模型,灌入大量已有对联数据进行训练,大数据也赋予了机器过人文采——输入上联后,对出的下联水平还挺高,周明评价道。他一时按捺不住,携系统到处以文会友,微软对联自然声名鹊起。他连续三年在微软的21世纪计算大会上演示微软对联,每一次演示都体现了新的进展。在其后的十多年中,微软对联颇受欢迎,被公认为中文自然语言处理的里程碑。

 

 

图注:这一紧跟时事的对联正是微软对联的手笔

 

在微软亚洲研究院工作的21年中,有不少大公司想要挖走周明;身在微软,见过了互联网热与移动互联网热,他本人也早有创业的想法,但他认为那些契机都不够成熟——他一直迟迟未动,正是为了等待一个成熟的机会。

 

2018年,大模型BERT和GPT-1横空出世,周明看到了一个令他极为振奋的例子:BERT 在斯坦福大学构建的机器阅读理解数据集 SQuAD(Stanford Question Answering Dataset)2.0上取得了全新表现,阅读理解能力大大提升,甚至超过了人类水平。

 

将预训练模型作用于新的任务,通过微调即可获得不错的模型。这样的新方法能够用一套机制高效解决多项 NLP 任务——周明从其中看到了未来 NLP 技术发展的方向,也看到了解决 NLP 产品碎片化问题的可能。

 

其次,他也看到了这个年代的需求:数字化转型。眼下各行各业都走向了数字化转型:收到银行打来的电话,对方声音甜美,就算她的目的是推荐基金,也让人忍不住想多听两句——可谁知对方不是真人,而是智能电话客服;走入一间饭店,前来接待的也不是真人,而是声音像小男孩,身材圆滚滚的点餐机器人……周明看到了处处都要用到智能客服、机器翻译、文本生成等NLP 技术的未来。

 

既有技术,又有需求。 这一次,周明认为创业之箭不得不发。2020年12月,离开工作21年的微软后,他加入创新工场担任首席科学家;2021年6月10日,创新工场孵化出了澜舟科技。周明对澜舟的定位是向各行各业客户提供价廉物美的NLP云服务,且要如同 接入水、电一样简单。

 

创业初期,澜舟只有2位员工和2位实习生。通过调研,周明了解到用户也都希望用轻量化的语言模型,以此节省开支。周明选择了带领这只「小而美」的团队投身轻量化模型的研发。他说,「既然条件有限,那幺我们就要比拼算法的能力,而不是比拼计算的能力;既然人手有限,那幺就成为研发型团队,好好去做轻量化模型。」

 

于是这支小团队以语言学知识增强、训练技术优化、模型压缩、检索增强等方式攻克下了轻量化模型,并取名为「孟子」。孟子这个十亿参数量的小模型,一经发布便冲上了 CLUE(Chinese Language Understanding Evaluation,中文语言理解测评基准)榜首,这份成绩已使周明十足自豪。

 

而孟子后续在机器翻译、文本生成、行业搜索等领域的实际应用效果,也实现了周明当初「创新小团队,四两拨千斤」的设想。例如,澜舟技术支持的智能写作产品可以由用户自主选择标签,选定了风格、场景设定、品类热词等选项后,模型就能自动生成一段符合要求的文案。由于其生成目的为产品营销,因此文案颇为生动,不但不像出自 AI 之手 ,还符合网络传播要义,挺有「爆款」的面相。

 

 

图注:智能写作产品生成文案

 

在采访中,周明不禁感叹道, 「人生是命中注定」 ,虽不曾按照自己心愿读过文科,但凭着对于语言的这份钟爱,仍能将所学技术挥洒在语言的研究上,是为人生一大幸事。

 

3

 

聆心之声

 

AI 如何做到共情,也是清华大学计算机系副教授黄民烈专攻的课题。表面上看来,他似乎是在2017年开发一个情绪化聊天机器人时受到了启发,因此想探索 AI 情感智能这个领域。可实际上驱使他做相关工作的想法,其实出现得更早。

 

 

图注:黄民烈一直致力于研究对话系统

 

众所周知,作为国内顶级学府,考入清华的学生可谓「神仙打架」。有不少清华学生表示,自己的自信心最强的时候是在开学第一天,那时自己顶着某市状元、金牌得主的光环入学,认为自己在清华里也能大展拳脚。然而和身边看似不起眼的「学神」们相处下去,慢慢就会发现自己的杰出不再特别。对自身价值的疑问,再加上学习内卷,压力愈大,于是整个人的色彩也变得越来越灰色调……

 

黄民烈在清华大学任教时,就看到了不少学生因学业、家庭、人际关系等各种原因而患上抑郁症,彼时他尝试通过班主任的身份去帮助学生,想尽力化解他们的难题。但由于对心理学的了解不够透彻,这样的努力就如同大多数高校开办的心理咨询处一样,效果并不明显。

 

直到有一天,他发现自己有两个学生也患上了心理疾病。他们甚至因为服用药物而受到副作用困扰,严重影响了学习和生活。要知道,在我国心理健康医学发展得不够全面的现状下,患者如被确诊,为其健康考虑,医生都会尽量建议服药。这种难免显得有些「一刀切」的形式,让许多患者苦不堪言,而服药导致的嗜睡、乏累、情感麻木……对他们来说更是一道迈不过去的坎。

 

出于对门生的爱护,黄民烈开始思考, 心理疾病是否可以用不吃药的方式治疗? 世界上有没有更先进的治疗方式?

 

术业有专攻,他便带着这个问题去请教了心理咨询师。在沟通中,咨询师告诉他国外已经出现了让聊天机器人来安抚患者情绪的手段。而黄民烈一直研究的方向正是对话系统。他想,自己研究的对话系统,正可以和心理咨询紧密结合。那幺,自己有没有可能创造出一个能共情的心理咨询机器人?面对心理咨询机器人,学生可以倾吐自己的困扰,而机器人有着比肩咨询师的灵智,能提供合乎情景的情绪支持和温暖语言,给对方一个在线的「拥抱」。

 

这样的 AI 太聪明了。相信不少NLP 学者 都有虚拟伴侣、类人 AI 的终极幻想,但终归因为目标太过遥远而自言放弃,并选择去做一些落地更快的研究。而帮助学生乃至于帮助人类的契机,给足了黄民烈不放弃的理由:他心想,既可以助人,又能把自己所研究的技术与实用场景相结合,这是一条可行之道——于是他在清华带领课题小组深入学习心理学专业知识,筹划了四五年时间后,在2021年,聆心智能成立。

 

创业后,聆心一直专注于研究让科技赋能心理健康,而最让黄民烈自豪的一个成果,便是 Emohaa 情绪支持机器人。

 

一开始,团队收集了海量通用语料用来训练Emohaa的基座模型,使得Emohaa达到一个16岁少年的说话水平——通顺,但还不够成熟,也无法担起心理治疗的重任。

 

于是,黄民烈带领团队,将心理咨询行业数据与算法紧密结合,让Emohaa学习心理咨询师的话术,了解何为面质技术,何为自我暴露,何为情感表达……Emohaa在「专业进修」后,达到了实习心理咨询师的技能水平。后来,Emohaa先是在学生圈里打开名声,随着在公众号里的推出试用,它的来访人不再限于学界,而是逐渐迎来了大量需要陪伴和倾诉的网络用户。

 

随着Emohaa声名渐起,有不少人提出,AI 不是人,没有灵魂。它们真的有安抚情绪的效果吗?尬聊会不会让人越聊越来气?

 

而黄民烈所在的清华大学CoAI课题组正是瞄准了「让 AI 学会共情」这个靶心,提出了「确认用户具体问题——共情、给予情感支持——提供解决方案」的 共情机器人三阶段理论模型。

 

举个例子,当来访人倾吐自己的问题:「由于疫情原因,我已经一个人在家封控一个月了,不能出门工作,也不能出去旅游、约会,我感觉好郁闷。」

 

而Emohaa反应的第一阶段是确认用户具体问题:「你是说,你一个人在家封控一个月了,不能出门,耽误了工作和约会,很郁闷对吗?」

 

第二阶段则是通过共情、理解表达支持:「 我很理解你的心情,在家封控确实挺压抑的。」

 

第三阶段是为用户提供解决方案:「Emohaa给你一个小建议,你可以去做一下自己喜欢的事情,或者跟着我的引导,一起做个冥想。」

 

目前,共情与情感支持是 Emohaa 最重要的课题。虽然让 AI 变成柔情蜜意的万能助手这一梦想仍然有些遥远,但 Emohaa 已经迈步踏上了走向共情的梦之旅程。面对心情低落的来访人,它不会像不懂共情的普通人一样劝慰「 你要振作起来,老这样负能量可不行」、「 你应该看看这个世界好的一面」等不能真正理解对方处境与心情的话,而是即便当来访者有负面情绪时,仍然选择包容和理解,让人类感受到无条件的温情陪伴。

 

聆心团队曾做过一个实验:在21天的实验周期中,让来访者定期与 Emohaa 交流,聊聊让自己感觉压抑、郁闷的负面事件,结束咨询后用抑郁量表进行测试,得到来访者的量化情绪指标。经过一整个实验周期,来访者的抑郁、焦虑量表分值均出现了显着的下降,这说明与 Emohaa 聊天的确可以给人带来情绪的改善。

 

同时,外界也有不少疑问的声音。比如,来访者已经知道 Emohaa 是个机器人,这意味着「不是用真心在做咨询」,那幺本就需要真诚相待的来访者还会愿意聊吗?

 

而黄民烈团队经过多次盲测以及对用户的深入访谈,却发现事实完全出乎人的意料——出于多种顾虑, 其实有许多来访者根本就不想找真人聊天 。

 

虽说人是憋坏的,但来访者也害怕给自己的倾诉对象带去负能量,也不愿和一位陌生的咨询师谈论自己的隐私……对比而言,他们更愿意和 Emohaa 聊天,因为与 AI 交流毫无负担。这一幕真有些像电影《Her》中的科幻场景: 明知对方不是真人,可带来的抚慰却是真的。

 

同时北京理工大学贾晓明教授的一项研究也证实了这一事实:将受试者分为两组,分别接受真人咨询师和假装成 AI 的真人咨询师的服务,结果显示两组的咨询效果相仿,没有明显区别。这也说明受访人不会受先入为主的观念影响,对 AI 咨询师产生抵触心理。

 

目前,Emohaa已经成为一位不错的「心灵伙伴」,但黄民烈与团队设定了一个相对长远的目标,要将 Emohaa叠加经过循证医学验证的数字疗法和最全的心理治疗练习方案,让它提高到一位「专业咨询师」的水平素养,期待它最终能够在精神心理诊疗工作中做到高精准度、高效率和高度智能化。同时,聆心还需要攻克「真正为来访者给出解决方案」这个难关,有了实质性的帮助,来访者会更愿意跟 Emohaa 进行持续的、定期的聊天。

 

可以想象,随着来访人的数量增多,使用时间变长, Emohaa 能够得到从 0 到 1 处理一位心理亚健康状态人士心理问题的经验。经验增多,会带来 Emohaa 的迭代进化,并吸引更多的用户关注,最终实现聆心「 awareness (人人都能及时感知自己的心理问题)、 accessibility (人人能获取), affordability (人人能承担)」的最初梦想。

 

「这才是我们的真正的星辰大海」,黄民烈说。

 

4

 

重修巴别塔

 

《圣经》中记载,在远古时代,世上的人都说着同样的语言。由于语言的相通,人类发现合作的力量不可估量,于是决定联合起来修建一座通天的高塔,以此传扬自己的名声。为了阻止这个计划,上帝大手一挥,使得人们顿时说起了不同的语言。修塔人之间无法沟通,建塔之功半途而废,尘世也因语言不通而陷入无休止的争端和混乱当中。这便是「巴别塔」传说的由来。

 

与 AI 对话、让机器明白人类的意图与喜怒哀乐,正宛如重修巴别塔一般——跨语言任务一直是 NLP 的经典问题,这当中不仅包括不同语种的人类自然语言,更包括人类自然语言与机器语言的交流和理解。为追逐这一史诗级梦想,许多勇敢者投入了 NLP 创业当中,即便这是一个他人认为发展颇慢,不被看好的赛道。

 

近年来,国内人工智能市场风起云涌,国内 NLP 创业公司虽然也成立了不少,但相比起计算机视觉在产业落地的爆发性发展则显得缓慢了许多,不仅没有出现CV领域中那样崭露头角的四小龙,就连为人称道的独角兽也未曾出现过一家。

 

NLP素有「人工智能桂冠上的明珠」之盛誉,但这一美名也明示了其技术难度。「重修巴别塔」的难度之高,其实与历史机遇有关,见证了 NLP 一路走来的周明解释道,而这就要从统计机器学习时代说起了。

 

在预训练模型出现前,自然语言处理使用的是统计机器学习方法。在统计机器学习中,有一个环节叫做特征工程,其含义是将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。

 

而统计机器学习的特点是针对不同的任务,需要人为定义不同特征。当工程师遇到新任务,特征完全未知,便需要去验证自己对于特征的猜测。这就导致每一个任务都需要工程师凭借工匠精神,在黑暗中慢慢摸索。

 

并且,任何一种自然语言任务的特征都不一样,文摘与搜索、机器翻译等不同任务的特征也不一样。因此在大模型出现前,工程师需要针对每一种语言,每一种任务做特征工程,更别提准备语料的代价。这便使得 NLP 研究无法规模化。

 

拿这样的NLP技术去实现工业需求,可以想象,其落地业务也是碎片化的。创业公司为餐饮客户做出了一个点餐机器人,却不能把这个业务移植到银行客户的需求上,利润空间被压缩到非常之小。因此,在预训练模型出现以前,NLP确实无法解决特征工程和碎片化问题,所以前期一直没有出现一个明星级别的 NLP 公司。

 

而在 BERT 和 GPT-1 发布后,许多创业者,其中当然也包括周明,嗅到了用预训练模型解决碎片化问题和特征工程的机会。周明回忆道,关于预训练模型的共识在 2020 年的时候才普遍产生。然而遗憾的是,2020年已在疫情之中。因此,即便是在 NLP 的机遇之年,敢于入场的创业者也变得少了,创业公司的研究也放缓了脚步,也许这给了大众以「默默无闻」的印象。

 

而现在,To B 碎片化的问题已迎来曙光,正待创业者们付诸实践,但 NLP 创业中又体现了另一个问题,正是被大众调侃许久的「人工智障」式回答,也就是 鲁棒性不足。 相比起偏于感知智能的计算机视觉,NLP 的终极目标是达成认知层面智能,还有着更长的路要走。

 

然而以上,难免是一种老生常谈。每每提到 NLP 的卡点,几乎每一个从业者都会搬出这些说法。NLP 被誉为桂冠明珠,这体现了 NLP 研究者攻克难题不容质疑的骄傲,但明珠的难以摘下,也体现了一整个行业的困境——在一个问题长期被提出后,我们就应该考虑其解决方法。

 

对此黄民烈认为,鲁棒性不足, 表面上是技术的难点,其实是场景的难点。 要让 NLP 达成认知智能,首先需要让 AI 真正理解工作领域的知识。在训练 Emohaa 机器人时,黄民烈与聆心团队就进行了知识增强,让 Emohaa 学习深度心理学知识,教它了解现有心理治疗体系、参与性技术、影响性技术等等。而黄民烈之所以选择「 AI+心理健康」的赛道,也是因为他在多年前就为学生和朋友深入了解了心理健康行业知识。

 

有了对精神心理需求的深刻理解,这才有了他后来创业的契机。黄民烈建议道, NLP 创业不能先创业后找场景。 作为一个 NLP 创业者,应当理智对待创业潮,并询问本心,去真正寻找自己有经验、有热情的赛道,将该领域的专家知识规则结合到训练数据中,才能脚踏实地把公司做下去。

 

让 AI 达到真人一般灵活、开放、知情识趣的语言水平是 NLP 研究者的终极梦想,但在尚未达到这个目标时, 不够聪明的 AI 也并非一无是处。 事实上,目前不少 NLP 公司的路线都是「 Human Intelligence + Artificial Intelligence(真人智能与人工智能结合)」。以澜舟为例,产品营销工具生成的文案,也未必每一句都正确,但是员工经过检阅,可以将错误快速更改,在保证质量的情况下达成高效输出。

 

「人跟机器各得其所,其实这是一种比较融洽的方式。」周明说。

 

而对于「 NLP 跑不出独角兽」、「 NLP 没有四小龙」、「 NLP 不如 CV 繁荣」等说法,简仁贤倒认为 大家应该「冷眼」看待。 当某种现象被提出,并伴随着「为何出现这样的现象?」的疑问时,我们首先应该做的是警醒头脑,判断对于该现象的描述是否客观属实。

 

在简仁贤眼里,企业还是应当以实绩论短长,目前,一些 NLP 公司采取的发展模式为在自己擅长的一个或多个赛道提供技术或解决方案,积累了不少 To G、To B 的签约客户。尽管这种「闷声发财」的风格在媒体时代显得格格不入,但有了上一轮的CV四小龙发展中遇到问题的前车之鉴,小步快跑、「以时间换空间」或许恰是这一批NLP公司的最佳选择。

 

「怕什幺真理无穷,进一寸有进一寸的欢喜」,在我们关注行业时,是否应当拂开独角兽的虚名,将 NLP 公司的发展理性看待?

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。