当前位置:江苏数码科技 >> 深度 >> 文章正文

机器人不能制造大新闻

发布于:2020-11-10 被浏览:2875次

“自动新闻写作机器人按照算法第一时间自动生成稿件,瞬间输出分析判断,在一分钟内将重要信息和解读传递给用户。”

2015年,阿尔法狗还没有横扫国际象棋世界,人们也没有担心自己智力有限。但今年9月,腾讯财经发表了一篇名为《8月CPI同比上涨2.0% 创12个月新高》的文章,煽起了人工智能的翅膀。这篇文章的作者不是人类,而是写作机器人.

从此,人工智能向人类智能和灵感王国迈出了第二、第三、更多的步伐。

2016年8月,里约奥运会成为腾讯、字节跳动等互联网公司AI写作机器人的橱窗,其“二级”发布效率让一群碳基生活远远落后,甚至让媒体汗颜。人们担心,用不了多久,文字创作者就会被AI取代,成为被技术淘汰的劳动力。

但是,四年过去了,这些人应该还在吃喝,没有事业终结的迹象。曾经威胁文字创作者职业生涯的AI写作机器人在哪里?

作家杨静怡

孙,三位编辑

放大团队的规划

抢饭碗的机器人

事情要回到2015年。——年,腾讯的Dreamwriter曾经引发了互联网对AI写机器人的想象。[2]据腾讯“Dreamwriter生产一篇稿子平均只要0.46秒。”人工智能项目总监、Dreamwriter负责人刘康介绍,[3] Dreamwriter每天最多能产生2500多篇文章。[4]

小明机器人是由字节跳动和北京大学计算机学院联合开发的,它是一个晚出生一年的书写机器人。2016年里约奥运会期间,小明博特13天成功撰写457篇事件报道,每天30篇报道,一度成为各大科技媒体的热门话题。[5]

奥运会后,小明bot进入了体育、科技、金融、房地产等十几个领域,生产力翻了一番。截至2017年,稿件总数已达2万余篇。那年年底,小明博特获得了“吴文俊奖”,这是中国人工智能领域的最高荣誉奖。[6]

和小明bot同龄的写作机器人是DT Draft King,是阿里和CBN合作推出的。被誉为“写作机器人尖子生”[7],它不再满足于写作,甚至发明了一个新词:“智能写作”。当时的第一财经首席数据科学家唐开智曾经公开设想过写作机器人的更高级进化形式:DT手稿王将与商业写作场景相连接,成为一个开放的写作工具,最终成为一个具有商业目的的自由写作助手。[8]

字节等互联网大公司有今日头条,腾讯有腾讯。阿里有第一财经。几家公司不缺平台,不惜倾斜流量。AI写机器人可以在自己的平台上形成正向循环。理想情况下,在“创作稿件——发布曝光——反馈学习——继续创作”,的闭环人工智能写作机器人可以通过不断的学习带来越来越多符合主流读者取向的内容。乐观的预测是,机器人将取代全世界的写作者.

然而并没有。

机器人败走新闻界

其实业界早就预测到了AI写作机器人的失败。

2015年,BBC的一项数据研究显示,未来20年,人工智能取代记者和编辑的可能性仅为8.4%;至于作家和翻译,略高,仅占32.4%。[9]

如今,在中国互联网,如不去主动搜索,读者已经很难再看到AI写作机器人生产的新闻。

DT书稿王的沉寂离其高调发布只有一年零一个月了。截至目前,在第一财经官网,DT只留下了6篇“0评论”、“0喜欢”的历史文章,其中最后一篇发表于2017年6月9日。主张“智能新闻时代已经到来”的CBN首席数据学家唐开智也低调离职。

小明博特获吴文俊奖后,字节跳动没有公布项目后续进展。其头条的关注领域逐渐缩小,只有足球比赛保留在其创作内容中,直至停止。今日头条App上的最新文章停留在2019年8月29日,此后再无动静。

Dreamwriter还是活跃的,很可能是唯一活跃的写作机器人——。如果足够细心,还是可以在一些事件报道、金融短信、各地天气预报中找到它的踪迹。

一个有趣的悖论是:AI写机器人成功吸引大众眼球,人类需要写文章介绍——的普及。怎么才能相信这种高科技能产生好的内容?

机器人的事儿,能叫洗稿吗?

这种“非标文”,是人类智慧的典型产物。需要逻辑,语感,审美,价值观。想要写的清晰流畅,大概需要一些天赋。相比之下,AI写作机器人的速度是无与伦比的,稿件质量本来就有欠缺。

以Dreamwriter为例,语言表达存在很大问题。腾讯内部人士告诉放大团队,Dreamwriter创作的稿件存在大量表述缺陷,需要编辑手动调整大量细节,才能达到发布标准。有时同名同姓,在同一篇文章中不一致,编辑必须仔细校对这些常识性错误。

而且AI写作机器人没有职业道德。篮球新闻读者何宇发现,梦工厂已经学会了懒惰。

何宇告诉放大镜小组,梦想家在腾讯新闻中创作的一篇名为《布克27分艾顿24+12太阳轻取奇才 八村垒21分》 [10]的文章在NBA中国官网新闻《布克27分艾顿24+12 太阳首发悉数上双克奇才》 [11]中被大量抄袭。

左:梦想家创作右:NBA官网稿件

体育赛事的新闻内容相似是可以理解的,但这篇文章并不是“相似”那么简单。五年前,腾讯斥资5亿美元,争取未来五年NBA独家数字媒体转播权。虽然不知道是否涉及到手稿的版权合作,但是抄袭别人的手稿并不能体现机器人写作的价值。

AI的优势应该是更快地写文章,而不是成为一个没有时效性的‘爬虫’。”在赫克托耳看来,这是对技术的误用。

在AI创作圈,“洗稿”不是Dreamwriter的“人”的问题,DT手稿王在写稿时也很依赖其他媒体素材。

王在《中国商报》网站上发表了一篇署名的报告,主题是国家统计局例行发布的消费价格指数分析[12]。文章除了引用国家统计局工作人员的发言外,其余部分由几位专家的意见组成,均来自其他媒体已有的报道。

经常利用今日头条获取新闻的京思认为,AI拼凑出来的文章至少比营销号的“垃圾信息”更有价值,但同时她也承认,AI创造的内容确实不够好,不足以让她成为AI的忠实读者。

写机器人的目的是为了创作,而不是为了洗稿。开发者还会把他们手动撰写的新闻作为训练语料馈入,[13]以避免AI以制作爆款为目的成为营销作家,但这也导致了它的创作。非常克制3354生产的新闻算得上专业,却谈不上生动和有趣。,

广州大学的陈晓曦在论文《机器人新闻与记者稿件的对比》中比较了三对人工智能和记者的新闻发现:

AI写作机器人的优势包括:数据收集能力、数据处理能力、新闻写作速度。

人类记者的优势有:新闻洞察力、敏感性、深入挖掘新闻信息的能力、处理信息的能力、人文关怀、舆论评论、创新等等。

“http://”陈晓曦想。[14]

当写作机器人的人气消退后,用户根本不在乎作者是人还是AI。上海交通大学和佛罗里达大学的学者发现,大多数读者对是人还是机器写新闻不感兴趣。只要他们需要信息,他们就会睁开眼睛。[15]

毕竟很少有人类作者能记住自己的名字,更何况是AI。

只有人类特有的思维和情感才能生产出有‘人情味’的新闻,才能更符合受众的期待,机器会取代人类进行新闻写作的观点完全是杞人忧天。

目前AI写作机器人缺少一部能让读者记忆深刻的大作。

由Open AI发布的人工智能语言模型GTP-3一度被认为会成为“游戏破坏者”。从技术角度来看,GPT-3很可能是目前最先进的人工智能,其参数数量和训练数据集容量都处于行业领先地位。其中,前者比最大的同类产品高十倍,能带来更准确的结果;后者高达45TB,相当于167个英文维基百科(167 * 600万词条)的容量。[16]

高级款要带精品。2020年9月8日,GPT-3在《卫报》编辑部的指示下写了一篇文章,以“表示对人类的忠诚”。这句生动流畅的话让四个人大吃一惊:

没有感情的“填空机器”[17]

但第二天,GPT-3受到俄罗斯电视台的批评,称《卫报》耸人听闻:GPT-3生成的稿件几乎无法阅读,引人注目的发布版实际上是由工作人员打磨和整合的。[18]

就连被捧上天的GPT 3号也落败于文字。人工智能写作的问题是什么?

CBN北京分社前社长、CBN Global总编辑周信在2019年6月的个人博客中说,2016年左右他参与AI写作机器人的开发时,注意到了一个问题:“我不是人类。我是人工智能。很多人认为,我对人类构成威胁……我在这里想说服大家不用为此担心。人工智能不会毁灭人类。请相信我!”.

他批评人工智能写作算不上真正的创作,而是一种依托具体场景进行的数据替换工作,说这是“懒惰”开发商的结果。

比如你要写股市,首先要把股市里所有的股票信息,以及这类可以改变的场景和情况,都记录到这个系统里,然后格式化成填空题之类的文章,当新的信息进来的时候,把这些新的数字填入这些空白的地方。[19]

不解决AI“填空写作”的问题,AI自主创作高质量内容是伪命题。

据周信介绍,不仅国内AI写作,美国几家人工智能开发公司为路透社和美联社提供的AI写作机器人也遇到了同样的问题。"他们的路好像堵在那里了。"[19]

由于这个原因,AI写机器人产生的内容大多集中在财经、体育领域的时事通讯——上。这两个行业的时事通讯写作都是高度程式化的,只需要对信息点进行一定程度的整理和组合,然后稍加润色就可以成为新闻。

AI写作机器人的工作是“填空”

在意识到填空AI的问题后,越来越多的公司把写字机器人从正面背到背面。以一种隐藏的方式,不成熟的书写机器里的人会继续发光发热。

Dreamwriter穿着一件名为“天气趋势”的企鹅背心,迄今已悄悄地发布了15.6万份地区和县一级的详细天气预报。预报内容只有一百字,我们只需要理清最基本的天气信息,甚至可以应用模板自动生成。

腾讯不再强调AI机器人写作的噱头。只有细心的读者才能从文末标注的“梦想家写作”中读出这条推文的独特“价值”。

与被迫在幕后撤退的梦想家不同,今年7月刚刚宣布从微软独立出来的萧冰已经在幕后写了几年的财务总结。

“每天早上十点,一百多家企业的上市公告,每家至少有几十页。萧冰只需要20秒钟就可以生成一份财务摘要。”萧冰公司CEO李迪向放大镜团队介绍,“这项工作不能由人工团队完成,因为它不能由人工完成。”

早在2017年,就更名为“万”和“华”,分别与wind information和Wall Street合作,为金融机构和个人提供金融信息服务。[20]李迪还向放大镜小组透露,萧冰在过去的一年里创造了超过1亿元的收入,其中财务汇总业务非常关键。

全在AI的百度,用AI写东西更谨慎。即使它已经开发了几年自己的AI书写产品,直到现在也没有大规模使用。唯一一款对个人用户开放的AI辅助写作产品,是一款只有应用后才能使用的产品。[21]

当然,现在坚持让AI带头也没问题,只要你做好AI把事情搞砸的准备。

写作机器人退居幕后.一周后,AI搞砸了微软。在一篇关于种族主义的文章中,AI把同一个乐队的两个有色人种成员搞混了。[22]

被微软解雇的编辑布莱恩儒瓦内(Bryan Joiner)在《副总统》杂志上写道,他很高兴,他说:“微软的那些工作还是得由人来做。毕竟人工智能不知道自己能做什么,也不知道自己为什么要做。[23]

新生事物很难完美。我们不应该贬低AI写作机器人,它和AR、VR一样,都是技术的早产儿。未来可能有自己的世界,但不是现在。至于这些早产儿如何在未来的世界里找到合适的位置,那就是科技公司的“爸爸”问题了。

参考文献:

[1]8月份消费物价指数同比上涨2.0%,达到12个月来的最高水平

https://finance.qq.com/a/20150910/019573.htm

[2]机器人写作?是大数据分析!

http://m . haiwainet.cn/middle/352345/2015/0911/content _ 29153160 _ 1 . html

[3]“智能写作”:制作一篇稿件不到1秒

http://www.chinanews.com/business/2018/07-09/8560661.shtml

[4]腾讯的写作机器人上线两年了,现在每天写2500多篇稿子

http://www.nbd.com.cn/articles/2017-04-18/1095682.html

[5]新闻写作机器人——的应用及前景以今日头条新闻机器人张小明为例

http://media.people.com.cn/n1/2017/0111/c409691-29014245.html

[6]今日头条获得中国人工智能最高奖吴文俊奖

http://www.geekpark.net/news/225398

[7]第一财经新闻发布“DT选秀王”:写作机器人“尖子生”

https://www.yicai.com/news/5020955.html

[8]上海第一财经首席数据科学家唐开智:DT选秀王——新一代智能写作机器人

https://cloud.tencent.com/developer/article/1103678

[9]机器人会接受你的工作吗?

https://www.bbc.com/news/technology-34066941

[10]布克拿下27分,艾顿拿下24分,太阳以21分击败奇才八村

https://view.inews.qq.com/a/SPO20200801004236

[11]布克27分艾顿24分12个太阳全部首发上双克奇才

https://nbachina.qq.com/a/20200801/004160.htm

[12] DT草稿王主页

https://www.yicai.com/author/794.html

[13]刁、陈。“小明机器人”背后,书写机器人——的技术探索——访北京大学计算机科学与技术研究所万晓军博士[J]。中国传媒科技,2016(09):10-11。

[14]陈晓曦。机器人新闻与记者稿件的比较[J]。记者,2016(09):18-21。

[15]牟毅,夏凯,叶卡捷琳娜诺沃奇洛娃,徐坤。信息加工与人工智能创造内容的态度认知——基于信息双重加工理论的实验研究[J]。新闻大学,2019(08):30-43 121-122。

[16]为什么风靡全球的GPT 3号要砸大家的饭碗?

https://mp.weixin.qq.com/s/L3RxELKXJ1zp8Yo5b-2tYQ

[17]人工智能GPT-3为《卫报》写道

http://cn.dailyeconomic.com/tech/2020/09/11/9892.html

[18]AI会对人类“忠诚”吗?《卫报》“AI写文章”被控煽情

https://world.huanqiu.com/article/3zoxMSWeUv2

[19]中国智能写作发展的瓶颈在哪里?

http://zhouxin.blog.caixin.com/archives/206111

[20]微软萧冰第六代:中国金融机构90%交易者使用萧冰的总结

https://www.microsoft.com/zh-cn/ard/news/news_2018_50

[21]百度智能创作平台

https://ai.baidu.com/creation/main/index

[22]微软的机器人编辑器混淆了混血小混音歌手

https://www .《卫报》。com/technology/2020/jun/09/microsofts-robot-president-most-by-mixed-race-little-mix-singers

[23]微软指派给我的机器人做不到

https://www .邪恶。com/en _ uk/article/k7q 3je/MSN-news-algorithm-robots-Microsoft-cant-do-my-job

今年5月,微软用AI替换掉了MSN的编辑团队