潮新闻 记者 金春华
3月16日,百度召开“文心一言”新闻发布会,“文心一言”上线。
至今过去24小时,网络上关于“文心一言”的评价一直是褒贬不一。有很多网友深感失望,“等了这么多天,就这就这就这就这……”有网友开启调侃模式,“之前看到ChatGPT直呼要失业。今天再看文心一言,这辈子稳了。”
有网友“掐”了起来,有人觉得名字太拗口、记不住,也有人说“挺儒雅”……
今天开始,慢慢有比较多的网友表达了宽容和理解,“虽然不完美,也是一小步”“走出第一步,已经值得侧目”。
这一次,潮新闻记者受邀参加了测试,整个结果来说,相比同类产品的初级版本,“文心一言”还是有出乎意料的地方,比如它对中文的理解确实比ChatGPT要好一些。但是,如果你一开始抱着较大希望,那确实结果会蛮失望的。
对此,你可以理解为是走出的第一步,并且也是中国大厂的第一步。此前,潮新闻记者专门走进百度位于北京、上海、浙江等地的业务部门与合作单位,了解百度AI整体架构。这其实对大家进一步了解“文心一言”很有帮助。(具体请戳这里《潮声丨寻AI,到百度》)
好了,一起来看看潮新闻记者跟“文心一言”的互动。您也可以在文末留言有想问的问题,我们帮您去测测。
Round One:问名字
(1)你为什么叫文心一言?
这个回答应该还是有现成模板的。
(2)有网友说你的名字太拗口了,记不住,你有什么办法让他们记住
难道是忽略了是在问它的名字?我们换个说法。
(3)有网友说“文心一言”这个名字太拗口了,记不住,你有什么办法让他们记住
这个似乎不会是百度喜欢的回答,但,也算是你在抖机灵了。
Round Two:问下昨天新闻发布会相关情况
(1)昨天百度股票为什么跌了?
“做出明智的决策”,你是想暗示什么嘛?
(2)为什么GPT-4发布后,有关企业的股票就涨了?
“股票价格的涨跌仍然取决于市场的供需关系”,难道在暗示自己合作的企业很多?
(3)有网友说你不如ChatGPT,你写个千字以内的自白书向公众解释说明一下。请用知音体。
解释倒是解释了,知音体是这样的嘛?那我们换一种文体。
(4)用咆哮体改写上面这段回答
这是前后两次生成的结果。好像确实后面会比前面更精准一些。
(5)用鲁迅体改写上面这段回答
这里好像就是在发脾气了,哈哈哈。
Round Three:昨天李彦宏现场让“文心一言”做诗,我们也来测试了一把。
(1)写一首现代诗,欢迎世界各地朋友来杭州看亚运会。
好像还有模有样的。那么加大一下难度。
(2)写一首七言律诗,欢迎世界各地朋友来杭州看亚运会。
刚刚还想说字数居然对了,但后面发生了什么?那么来朗读一首吧。
(3)请用广东话朗读一下《静夜思》。
这一段确实还蛮正的。加大一下难度:
没有导出音频,语音上还可以,但文本处理还有点问题,比如把[注],也给读出来了,以及文本过长,后面就没有读完。
(4)用“看潮新闻”写一首藏头诗
你们觉得领导会给加鸡腿吗?
(5)给《蜀道难》画两张插图,一张中国画风格,一种科幻风格
你这好像要扣一半分,另一半大家觉得呢?
Round Four:毕竟不能忘乎所以玩,我们也测试了一下跟工作有关的。
(1)以《写在杭州亚运会倒计时一百天之际》为题,写一篇评论。
一方面,记者觉得自己暂时确实应该也不会失业了。另一方面,确实“文心一言”在文字生成这一块,还是有一定模式的。当然,目前来看,一些关键信息的差错还是蛮多的。比如它的时间还停留在“2022年杭州亚运会”……
(2)做一个杭州亚运会的新闻报道方案。
图片字比较小,记者摘了里面主要的架构如下,好像也是有模有样的。
杭州亚运会是一项重要的体育赛事,将于2022年在中国杭州举行。为了向全球媒体报道这一盛事,我们制定了以下新闻报道方案:
官方新闻发布会
新闻稿
社交媒体报道
视频报道
专栏报道
总体来说,我们觉得“文心一言”在有模式框架的前提下,还是能够输出一定的像模像样的内容的,语音、文字都类似。比如语音朗读,这个都是有固定模式可以生成,比较方便。但涉及一些自由发挥需要创新的场合,还是比较弱,比如前面说到的鲁迅体、知音体、咆哮体,这种在网络上网友创作的比较多,但要写得像,其模式并没有那么完善。
这两天有专家评判“文心一言”像是小学低年级水平、GPT3.5类似小学高年级水平,评判标准就是“文心一言”大概能够明白字面意思,然后去自己的知识库找答案,确实大概就是这样一个意思。它目前更像是一个加强版的搜索聚合对话框,相对缺乏对提问者真实意图的揣摩、理解。而这一点上,GPT-4确实有比较大的进步。
但从AI发展历程来说,这也是其必须要经过的一个起点过程,就像AlphaGo类似的,也是需要不断调整优化升级。
这个过程中,其实有两点非常关键,一个是优秀的算法、强大的算力,一个是优质的数据。相比下,前者靠企业、高校等攻关团队技术来攻克,后者需要现实世界的支撑。很实在的一点是,GPT-4为什么这么厉害,因为喂给它的数据量大。有一个数据可以参考,之前有机构统计过,世界上的网站用英语的多达63.6%,中文的是1.3%,这背后就是数据量的区别。而这,对以“大力出奇迹”的大语言模型来说,是要想尽办法去解决的难题。
所以,从这个角度来说,“文心一言”,我们可能还是要给它更多时间让它成长吧。