百度文心一言发布后,网络上一片嘲笑和质疑之声。
特别是文心一言的文生图,凡是和动物、植物有关的成语、菜谱,生成的图都特别…..特别喜人!

唐伯虎点秋香

鱼香肉丝
不少网友认为:百度这是套壳,先把提示词机翻成英语,再到国外开源软件上找图。比如:车水马龙就是一辆车在有水的街道上开,还有一条龙;夫妻肺片就是一对男女的肺。

夫妻肺片

车水马龙
套了谁的壳呢?
先说是套了ChatGPT的壳。可是ChatGPT并没有文生图的功能(可以理解图片),至少目前还没有公开测试。稍后发布的谷歌bard也没有文生图的功能。

GPT-4理解图片
后来,又说是套了bing的壳,网上很多关于百度文生图的图,就是和bing做对照的。

必应生成的娃娃菜
可是,3月21日,微软才宣布将AI图像生成功能Image Creator引入新版必应和Edge浏览器。百度的文心一言是16日发布的,时间上对不上。
好了,现在又有人说是套壳Stable Diffusion 或midjourney,还专门去问文心一言。可是这两者都是著名的AI绘图软件,midjourney的作品《太空歌剧院》还在美国科罗拉多博览会的年度艺术比赛获得首奖。我没有用过这两种软件,但看过这两种软件生成的一些图。无论如何都无法相信文心一言生成的那些拙劣的图是这两种软件生成的!

midjourney的《太空歌剧院》
从某些生成的图片看,我们也无法相信这是翻译后生成的图像。
1、飞黄腾达:百度翻译为be successful in ones official caree,当然还有其他译法,比如climb up the social ladder rapidly; come into ones kingdom;等等,无论如果,机翻后不管问谁,都不会生成一个穿黄衣在天上飞的人。

飞黄腾达
2、群雄逐鹿:feudal lords vying for the throne(争夺王位的封建领主),英文里有鹿吗?可就是生成奔跑的鹿!

群雄逐鹿
3、车水马龙,incessant stream of horses and carriages,确实有马有车,可英文里没有龙啊,英文怎么画出龙头来的?
肯定不是翻译后接入英文绘画AI系统的。
但是,为什么画总线和鼠标,结果画出个公共汽车和老鼠(总线和公共汽车的英文都是bus)?画起重机,却画出个鹤(起重机和鹤的英文都是crane)?

鼠标和总线

所有大模型AI训练的语料库都来自网络上的公开信息,包括中英文信息。应该是因为文心一言同时采用国内国外数据集(国内可能没有大规模图片数据集),也可能是语义标记。而且文心一言在生成图片时仅从文字的字面去理解提问,部分图才会出现这样的生成效果。
……文心一言应该建成语和俚语数据集、菜谱数据集了!
其实更重要的是,如果用户是出于本身的需求提问,那么就应该优化提问词:比如用多个词提问(相当于文献检索中的逻辑与),限定范围,等等。
但目前看,即使出错的“中英歧义”词组短语—主要是成语和菜谱,也不是站得住脚的套壳证据。
如果想得到更真实的证据,应该同时打开文心一言和Stable Diffusion( 或midjourney),就同一提示词(外文用百度机释)进行提问,看结果是不是相似。
有人同时在文心一言和必应同时提问,生成的图大不相同,必应更符合提问者的原意,说明必应的image Creator在文生图方面比文心一言要好。
百度的文心一言文生图肯定是自研产品,没有套壳。
其实,谷歌的bard连三位数的乘法都算错,百度画错几张图真的不难怪。
李彦宏在接受采访时承认:文心一言在发布时相当于ChatGPT在去年11月底时的水平,就是比ChatGPT还要差一些。
但我们要给自研技术和产品一点信心和时间。不要对自己的产品这么苛刻。2月谷歌Bard发布时翻车,股价跌去1000亿美元,却一言不发。现在公测甚至不如百度,也一言不发。文心一言出点问题就谣言四起、肆意抹黑,甚至兴高采烈。
其实,文心一言经过调整, 望文生义的辣椒已经有了改观,下面是几张网友刚提问得到的图。



至于文心一言原来不靠谱的绘画,我建议大家和我一样,下载保存,时不时看一看,笑一笑十年少嘛。

胸有成竹

三杯鸡

白切鸡