陈腾将AI部门负责AIGc部门的负责人给喊了过来。
所谓AIGc,是Artificial Intelligence Generated content的首字母拼音。
翻译过来,就是“人工智能生成内容”。
顾名思义,AIGc这类AI的作用,就是生成一些内容。
2022年以后大火的Gpt,就是最广为人知的AIGc。
除此之外,还有AI作画、AI生成视频,都在AIGc的范畴之中。
在AIGc大火的时候,许多人认为一个全新的时代将要到来。
画画、写作、作曲……这类创作性的工作,由AI就能够完成。
然而理想很丰满,现实很骨感。
陈腾在这些AI工具大火的时候,也玩过几次。
只不过再尝试几次之后,就会发现这些AI工具存在着重大的缺陷。
文字类AI生成的内容牛头不对马嘴。
上一秒说过的话,下一秒就会忘记,记忆短得像是七秒钟记忆的鱼一样。
在算力达到一定程度之前,AI对于上下文内容的记忆能力永远都小得可怜。
不过用来写些没什么意义的检讨、总结、日报周报,还是相当不错的。
以及在写代码的时候,生成一些简单的代码。
图片类AI生成的内容同样存在一些问题。
比如说早期一直被诟病的手部细节,比如说只能生成动漫类型的图片。
一旦生成写实类的图片,就会显得非常失真。
用来做辅助工作还行。
要是想要靠AI独立地完成一些任务,还有很长的路要走。
2022年的AI水平尚且如此,2015年的AI水平就更加不用说了。
不过现在能迈出第一步,陈腾还是非常感兴趣的。
“老板,您找我?”
眼前的男人四十岁不到,叫做魏龙,是国内人工智能领域的一位专家。
他从腾达做手机语音助手的时候,就来到了腾达。
在语音助手这一块,做了相当多的工作。
技术水平是有口皆碑的好。
“对,我听朱岩哲说你们推出了一个AIGc的测试版本?”
“是的,目前我们的对话大模型暂命名为dh,版本号为0.1。”
“dh?”
“对话的首拼。”
“原来如此。”陈腾笑了笑,“那这个dh0.1现在大概处于什么样的水准?”
“对话的智力水平……大概只有幼儿园小朋友的水平吧。”
陈腾微微点头。
这个水平,的确不高。
也难怪版本号是0.1,而不是1.0。
“你觉得如果我们这个dh0.1如果需要提升,目前最欠缺的是什么?”
“数据。”魏龙毫不犹豫地回答道,“绝对是优质的数据,我们这个模型的水准还是不错的,就是数据实在是太少了。”
“数据吗……”
陈腾倒是没怀疑魏龙说的模型水准。
因为这个dh模型的基础,其实是【LSm人工智能语言学习大模型】。
就是陈腾上次五连抽,在系统上抽到的那个。
系统出品,怎么都不会太差劲的。
在抽到这个大模型之后,魏龙手下的技术团队又基于这个模型做了一定程度上的改进。
所以模型水准陈腾是非常信任的。
不过模型的学习能力强是一回事,数据又是一回事。
如果将模型比作一个人,优秀的模型就是天赋很高的天才。
可就算是顶级的天才,没有高质量的学习资料,能学到的东西也有限。
现在腾达的这个dh模型,缺乏的就是学习资料。
“我们现在的数据源有哪些?”
“就是各大平台上网友们交流的一些数据,比如短视频平台的评论区,直播平台的弹幕。不过这些数据的质量,实在是太低了。”
陈腾微微点头。
魏龙说的很有道理。
短视频平台的评论区,有相当多的一部分评论都是没什么意义的回复。
这个没意义,指的是对AI训练没意义。
比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。
对于AI训练来说,意义不大。
经过筛选处理过后,能用的数据少得可怜。
陈腾又想到了Gpt。
实际上第一代的Gpt是在2018年推出的。
但是第一代的Gpt在市场上,并没有搅动什么风云。
因为智能水平太低了,根本没有人乐意与这样的AI对话。
直到四年之后,足足喂了四年的数据,这才有了许多人愿意对话聊天的Gpt。
可见AI的学习与发展,是一条十分漫长的路。
“如果按照现在的学习速度,你觉得我们的AI需要多长的时间,才能通过图灵测试?”
所谓图灵测试,就是让一个人去问AI问题。
看看这个人,能否发现正在与自己聊天对话的是AI。
能发现是AI,则未通过图灵测试。
未能发现是AI,则通过图灵测试。
这个测试方法在学术界具备一定的争议。
有人觉得这是一个很好的测试手段,有人则觉得这种测试手段没什么必要。
但是不管怎么说,图灵测试都可以作为一个AI智能程度的一个指标。
能通过图灵测试的人工智能不一定特别有用,但至少具备一定的智能程度。
“如果按照现在的学习速度,通过图灵测试的话大概需要两年吧。如果数据的量充足且优质,也许两三个月甚至更短的时间就能通过图灵测试了。”
魏龙有些无奈地说道。
优化模型、输入数据。
他们搞人工智能的,无非就是在做这两件事情。
“我倒是有一个想法,可以试一试,我们可以在互联网上,将dh0.1伪装成普通的用户,让真人用户和dh0.1对话试试。”
“可是dh0.1现在的水准,恐怕和正常人聊上几句,就会让人觉得聊天内容牛头不对马嘴了。”
“那有什么关系?”陈腾反问,“你现在上网去和人讨论问题,牛头不对马嘴的情况难道遇到的少吗?”
魏龙:“……”
还真别说,他确实在互联网上见证过生物多样性。
“那我们就伪装成真人,去和用户聊天?”
“嗯,你去找蒋华,让他配合你们弄些人机账号出来吧。”
“好的。”
“什么时候你们觉得这个对话模型有资格被称之为dh1.0了,我们就向用户正式开放我们这个对话模型。”
“如果能和大量真人进行对话,我觉得一年以内,甚至半年的时间我们就能达到1.0版本。智力水平,应该有七八岁小孩子这么高。”
“那还不错。”
陈腾对七八岁小孩子的智力水平还是认可的。
至少能对话了。
如果在这个基础上再进步,那就真的可以商业化了。