<返回首页

全球首个AI程序员Devin造假?业内人士:质疑有理,但程序员已离不开AI

2024-04-17 11:28:18  澎湃新闻  
加入收藏

·号称全球首个AI人工智能软件师Devin日前被网络博主质疑造假、炒作。业内人士分析认为,该位博主质疑有理有据,Devin的“惊人效果”确实存在一些商业炒作的嫌疑。

号称“全球首个AI人工智能软件师”Devin,如今被网络博主质疑造假。4月9日,一位自称有35年软件工程师经验的网络博主卡尔逐帧复现了Devin的演示视频并提出四点质疑,包括Devin所展示的编程能力存在一定欺骗性,“它处理的任务并非随机,而是演示者精心选择的刻意呈现”;此外,Devin在操作过程中看似修复了许多问题,但这些问题很多都是Devin的“自导自演”。

04:12

“全球首个AI人工智能软件师”Devin被网络博主质疑造假。(04:12)

质疑视频发出后,引发众多科技爱好者评论。上海市人工智能行业协会、大模型专班负责人王逸浩日前在接受澎湃科技(www.thepaper.cn)采访时表示,卡尔的质疑有理由据,Devin看似“惊人的效果”确实存在商业炒作、包装的嫌疑。但不可否认,AI如今已经成为程序员的必用工具之一。

首个AI程序员被指炒作,多次“自修自建”代码夸大实际效果

Devin是由Cognition Labs于今年3月12日发布的一项AI编程产品,并被宣传为“全球首位AI工程师”。在Cognition官网发布的长达1分50秒的演示视频里,Devin只需一句指令,就能实现端到端地处理整个开发项目,此外视频显示它具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码问题等能力;还可以按照用户需求同时执行多步骤工作流程,程序员们可以实时观察其进度,发现错误时,跳出指令就能修正。

卡尔针对上述视频经过逐帧比对后提出质疑。他认为,在上述演示视频的2.936秒处,屏幕左上角显示“他们搜索过这个任务”,这意味着演示视频中Devin处理的任务并非随机,而是演示者选择的。卡尔怀疑,这有可能意味着Devin在大部分的工作中并不出色,甚至比视频演示中的还要糟糕。

上述演示视频的2.936秒,屏幕左上角显示“他们搜索过这个任务”。

在运行的过程中,Devin出现了数次“自建自修”的情况,看似在做代码修复,实际上并不是修复它在互联网上找到的代码,也不是客户要求它修正的代码,而是自己生成的错误代码。卡尔质疑Devin的实际运行效率可能很低下,且存在很多毫无意义的操作。

此外,演示视频的前部分显示是3月9日下午3时25分,但后半部分的时间段却显示的是9日21时41分,这意味着Devin处理工作前后有6个小时20分钟的间隔。而卡尔在自己实际操作的过程中,仅花了35分55秒就可以复现Devin的工作。

卡尔表示自己并非反对AI,但他想谴责的是Devin团队这类“AI炒作”的行为。他希望人们对互联网上的任何信息,尤其是人工智能相关的信息保持谨慎怀疑的态度。

业内人士认为博主质疑有理有据

澎湃科技注意到,目前Devin 还没有开放使用,只能通过邮箱提交申请,外界对Devin的认知,基本都来自官方给出的演示视频,以及少数第三方开发和产品人员的评价。

据外媒报道,Cognition AI背后的团队成员共10人,核心团队共有3人,分别是Scott Wu、Steven Hao和Walden Yan,团队非常年轻。全体成员共拥有10枚国际信息学奥林匹克竞赛(IOI)金牌,很多成员在青少年时期也参加过信息学国际奥林匹克竞赛等。在发布“全球首个AI程序员Devin”这一信息后,Cognition AI备受外界关注。公开资料显示,此前,Cognition AI已经获得了彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。

眼下,AI编程究竟有没有夸大、炒作的嫌疑?AI程序员相比人类程序员可以做哪些事?

上海市人工智能行业协会、大模型专班负责人王逸浩告诉澎湃科技,AI程序员的存在确实可以协助人们独立完成简单的开发工作,甚至可以脱离一名真正程序员的帮助,能减少大量不需要创新的重复劳动,例如批量修改代码的命名风格、代码的依赖关系等。但卡尔针对Devin的质疑目前看来也有理有据,从演示的内容来看,Devin做文书工作的时长是一位经验丰富程序员的十二倍左右。

王逸浩认为,从其他相似业务的使用体验效果来看,Devin的“惊人效果”确实存在一些商业炒作、包装的嫌疑。一般诸如微软Copilot这样的工具都需要提供充足的上下文,而Devin明显对程序的逻辑理解都还不到位。

不过,在王逸浩看来,尽管Devin的功能存在部分夸大的情况,但并不能否认AI编程的发展趋势,“程序员们都在熟练地拥抱大模型带来的便利,试用各类代码辅助工具。程序员们离不开这些助手,类似于设计师们离不开Stable Diffusion。”

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
推荐信息
 
抖音如何撰写吸睛标题
 
Python图像处理库OpenCV入门教程:实践与构建
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器...
 
微服务架构最佳实践-方法篇
 
揭秘 Python 江湖中的15个冷门但超能模块
 
数据库为啥要融合+AI化?甲骨文Oracle 23ai给出了回答
 
一招教你解决页面中关联id的转换
在工作中,我们经常有这样的业务情况,实体间通过id实现数据业务上的关联,比如订...
 
SQL实用技巧-行列转换
 
Spring注入还可以这样玩!涨知识了
假设你有两个 CommonDAO bean,每个都需要在不同的环境中使用。这时,你可以使...
 
GPT-4o:实现跨越文本与视觉的智能交互
 
北京被曝小升初“掐尖招生”,北京教委:两校违反阳光招生要求被约谈,责成
 
DIY从入门到放弃:CPU主频/倍频/睿频/超频别迷糊
不管手机还是电脑,我们都知道CPU性能的重要性,作为核心组件,CPU决定了整机的性...
 
《DNF》手游将于5月21日正式上线 迪丽热巴代言
 
腾讯市值已达阿里两倍多!原因何在
 
苹果回应更新iOS 17.5恢复已删除多年照片:不用担心自己隐私安全
 
仅7地住房限购 北上广深会全面取消吗?
每经记者 甄素静 每经编辑 陈梦妤 据诸葛数据研究中心不完全统计,截至目前,全...
 
“国家队”出手收储房产,楼市格局真的要变了?
 
30年期超长期特别国债,今天正式首发,个人投资者能买吗?一文看懂
 
OpenAI与Reddit建立合作伙伴关系,利用其内容训练人工智能
 
Q1营收增速放缓,百度苦寻新引擎
 
不再区分一本、二本 江西2024年将首次迎来新高考
新京报讯 根据教育部统一部署,江西省作为全国第四批启动高考综合改革的7省(区...
返回栏目