GPT-4距离成为“天网”还有多远?
在很多科幻电影里,我们经常会看到电影塑造出一个会自主思考、自动执行任务的 AI 系统或智能机器人的角色。
图片来自:《2001:太空漫游》
(资料图片)
例如《2001:太空漫游》设计了一个超级智能计算机 HAL 9000 用于管理宇航员的任务;《终结者》塑造了自主学习人工智能系统天网,旨在控制美国的核武器和国防系统,以保证国家安全。
这些能够像人类一样思考和推理,还具有涵盖广泛的认知技能和能力的 AI 系统被称作 AGI。
AGI 的智能不限于特定领域或任务,还要有推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习能力等。
图片来自:《机器人总动员》
举个例子,Alpha GO 虽然围棋独步天下,但它不算 AGI,相比之下《机器人总动员》里的 Wall-E 则更符合 AGI 的定义。
AGI 的概念在人工智能领域已经存在了几十年,许多研究人员一直在尝试通过开发新的算法、模型和方法来实现 AGI。我们距离实现 AGI 还有多远呢?
微软研究院最近发布的一篇论文指出,OpenAI 最新的大语言模型 GPT-4 已经有 AGI 的雏形。
GPT-4 的广泛能力与涵盖广泛领域的许多能力以及在广泛的任务上表现出的人类水平及以上的性能,使我们可以放心地说 GPT-4 是迈向 AGI 的重要一步。
人工智能的火花
微软研究院的这篇论文全文共 154 页,满满的全是研究人员给 GPT-4 出的考题。
▲图片来自:YouTube@AI Explained
由于全文篇幅很长,YouTube 博主 AI Explained 对全文做了精选浓缩,让我们跟着他的视角来直观了解 GPT-4 的能力。
需要先说明的是,这些来自微软的研究人员在 GPT-4 的早期开发阶段就已经接触到了该模型,并开展了大约 6 个月的实验。
他们使用的是未作限制的开发版本,而不是现在作了安全限制处理的最终版本,因此文章提出的结论只是针对 GPT-4 原始模型。
让我们进入正题。文章指出,GPT-4 的一个重要新能力是可以在很少指示或者无示范的情况下正确使用工具,例如使用计算器,而这是 GPT-3.5 版本的 ChatGPT所不能做到的。
▲提示:有一条河流从左到右流淌、河的旁边建有金字塔的沙漠、屏幕底部有 4 个按钮,颜色分别为绿色、蓝色、棕色和红色
研究人员发现,GPT-4 可以与 Stable Diffusion 结合,根据文字提示输出一个细节丰富的图片,并且会根据文字提示来排列对象,提高了使用效率。
人类和其他动物的一个重要区别就在于,人类会发现并使用工具,如今 AI 也在朝着这个方向慢慢演化。
研究人员还让 GPT-4 去参加 LeetCode 上的软件工程师模拟考试。
取五次考试中最佳结果作为样本的话,GPT-4 在简单、中等和困难的三个等级考试中分别取得 86.4%、60%、14.3% 的成绩。
论文谦虚地说 GPT-4 的编码水平接近人类水平,那么人类表现怎么样呢?
LeetCode 的数据库显示人类在简单、中等和困难的三个等级考试的平均成绩分别为 72.2%、38.7%、7%,这还是剔除掉一题都答不上的人的数据。
可以说,就编程能力而言 GPT-4 已经比很多软件工程师还要优秀了。
GPT-4 不仅可以完成普通的编程工作,还能胜任复杂的 3D 游戏开发。
论文提到,GPT-4 在零样本的情况下用 JavaScript 在 HTML 生成了一个躲避障碍物的游戏 Demo。
只要在此基础上稍加优化,这个 Demo 完全可以变成一个游戏产品。而当研究人员用同样的提示测试旧版 ChatGPT,后者表示它做不到。
为了测试它的推理水平,研究人员拿了一道 2022 年国际数学奥林匹克竞赛的题目给它做。
▲你也可以挑战一下~
由于 GPT-4 的数据库只更新到 2021 年,这道题的答案并不在它的数据库内,因此它要完全靠数学逻辑推理能力完成。
GPT-4 答出了一个正确的解题逻辑,但在具体的答案上出现了错误,研究人员表示这是基础计算上的错误,而 ChatGPT 则只能生成一个逻辑不连贯的答案,水平差得远。
在问到一些像“一个游泳池可以放多少个高尔夫球”等很难回答的问题时,GPT-4 也能以合乎逻辑的方式去回答。
接着研究人员发现 GPT-4 可以调用其他应用的 API,来完成检索用户邮件、日历、坐标等操作,从而实现帮人订餐、订票、回复邮件等助理工作。
这一点在 OpenAI 最近公布的 ChatGPT 插件集功能上已经有所体现,GPT-4 模型能做的事绝对不只是文字生成这么简单,通过与其他应用 API 结合,它可以成为一个近似于系统的存在。
研究人员还发现了一个你很难察觉到的功能,那就是GPT-4 可以建立人类的心智模型。
研究人员为它设立了一个场景,GPT-4 很好地分析了场景中人的心理过程以及相对应的行动。
也就是说,GPT-4 能够像人类一样解读人类的行为与心理的联系,而不仅是单纯看到动作本身,这是 AI 的一大进步。
One More Thing?
这篇论文共分为十个章节,共介绍了 GPT-4 的多模态能力、生成和理解代码能力、数学能力、与世界的交互能力、与人类的交互能力、判别力,以及 GPT-4 局限性、社会影响、未来方向。
全文以抽丝剥茧的方式全面解读了 GPT-4 的能力,一经发布便受到了广泛的关注,火出了圈。
有意思的是,有网友在论文的 LaTeX 源代码注释中发现作者隐藏掉了部分信息。
▲从注释来看 DV-3 应该是 Davinci 3(达芬奇 3)
例如 GPT-4 的内部名称实际为 DV-3,与此同时它也是这篇文章的“第三作者”,也许是考虑到隐私问题,这被作者有意给隐藏了起来。
网友们还发现作者也并不太清楚 GPT-4 的实际成本,并似乎错误地把 GPT-4 称为纯文本模型,而不是多模态模型。
论文中与毒性内容相关的部分在发布时也被删除,或许这是考虑到避免给 OpenAI 造成不必要的负面影响。
总的来说,如果你对 GPT-4 能做什么、目前还有什么限制,或者对 AI 的进展有浓厚兴趣,可以通过此文进一步了解目前最强大的大语言模型。
标签:
推荐文章
- 鲜切花扮靓产业振兴路!每年可实现总产值800余万元
- 研究人员最新发现 单个细胞可同时处理成百上千个信号
- 陆军第73集团军某旅 创新升级模拟训练器材
- 长期暴露在光照下性能退化 科学家发现钙钛矿太阳能电池最大缺陷
- 宁夏启动双百科技支撑行动 构建高水平产业创新体系
- 陆军炮兵防空兵学院 毕业学员综合战术演习现地备课工作圆满完成
- 国内首颗以茶叶冠名遥感卫星 安溪铁观音一号发射成功
- 区域特色产业转型升级 四川屏山以“3+”模式推进科技创新工作
- 激发创新动能促进产业发展 无锡滨湖走出产业转型“绿色”路
- 绥化全域低风险!黑龙江绥化北林区一地调整为低风险
- 走访抗美援朝纪念馆:长津湖的寒冷,与战斗一样残酷
- 节后第一天北京白天晴或多云利于出行 夜间起秋雨或再上线
- 走近网瘾少年们:他们沉迷网络的病根何在?
- “双减”后首个长假:亲子游、研学游需求集中释放
- 获2021年诺奖的蛋白,结构由中国学者率先解析
- 他从一窍不通的“门外汉”,到重装空投“兵专家”
- 升旗、巡岛、护航标、写日志,他们一生守护一座岛
- 中国故事丨“沉浸式”盘点今年的教育好声音!
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- “双减”出台两个月,组合拳如何直击减负难点?
- 《山海情》里“凌教授”的巨菌草丰收啦
- 且看新疆展新颜
- 天山脚下,触摸丝路发展新脉动
- 160万骑手疑似“被个体户”?平台不能当甩手掌柜
- 网游新政下,未成年人防沉迷的“主战场”在哪?
- “辱华车贴”商家及客服被行拘,处罚要不放过每一环
- 沙害是自然界的恶魔,而他是荒沙碱滩的征服者
- 面对婚姻,“互联网世代”的年轻人在忧虑什么?
- IP类城市缘何吸引力强?玩法创新带动游客年轻化
- 国庆主题花坛持续展摆至重阳节
- 都市小资还是潮流乐享?花草茶市场呈爆发性增长
- 从1.3万元降到700元,起诉书揭秘心脏支架“玄机”
- 北京国庆7天接待游客超861万人次 冬奥线路受青睐
- 陈毅元帅长子忆父亲叮嘱:你们自己学习要好,就可以做很多事儿
- 报告显示:这个国庆假期,粤川浙桂赣旅游热度最高
- 中国科技人才大数据:广东总量第一,“北上”这类人才多
- 嘉陵江出现有记录以来最强秋汛
- 全国模范法官周淑琴:为乡村群众点燃法治明灯
- 线上教学模式被盯上,网络付费刷课形成灰色产业链
- 云南保山:170公里边境线,4000余人日夜值守
- 警方查处故宫周边各类违法人员12人
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- 受南海热带低压影响 海南海口三港预计停运将持续到10日白天
- 多地网友投诉遭遇旅游消费骗局,呼吁有关部门严查乱象
- 神经科学“罗塞塔石碑”来了:迄今为止最完整的大脑细胞图谱
- 汾河新绛段发生决口
- 陕西支援14省份采暖季保供用煤3900万吨
- 这场红色故事“云比拼”,穿越时空为我们指引方向
- 受琼州海峡封航影响 10月7日、8日进出海南岛旅客列车停运
- 辽宁省工信厅发布10月8日电力缺口橙色预警
- 广州10月8日至20日对所有从省外来(返)穗人员实施核酸检测
- 假期怎么过得这么快?国庆5.15亿人次出游,你咋过的?
- 国庆假期全国道路交通总体安全平稳有序
- 哈尔滨市南岗区爱达88小区将调整为低风险地区
- 新疆霍尔果斯市2例无症状感染者新冠病毒均为德尔塔变异株
- 百闻不如一见——北京大学留学生参访新疆
- 看,生机勃勃的中国
- 国庆假期中国预计发送旅客4.03亿人次
- 新疆兵团可克达拉市:195名密接者已全部隔离医学观察
- 山西平遥消防4天29次救援:拖着腿走路也要完成任务
- 国庆假期北京接待游客861.1万人次
- 冷空气自西向东影响中国大部地区 气温将下降4℃至6℃
- 新疆哈密市巴里坤县发生4.3级地震 震源深度9千米
- 国庆假期中国国内旅游出游5.15亿人次
- 公安部交管局:国庆假期日均出动警力18万余人次,5位交警辅警牺牲
- 受南海热带低压影响广东将暂别高温天气
- “数说”杭州无障碍改造:触摸城市“爱的厚度”
- 新疆霍尔果斯无症状感染者新冠病毒属德尔塔变异株 未发现高度同源的基因组序列
- 新疆伊犁州:妥善做好滞留旅客安置返回工作
- 国庆假期广西累计接待游客逾3611万人次 实现旅游消费272.41亿元
- 2021年MAGIC3上海市青少年三对三超级篮球赛落幕
- 新疆兵团第四师可克达拉市1名无症状感染者为餐饮从业人员
- 哥伦比亚遇上广州:洋茶人“云上”喫茶 传播中国茶“味道”
- 厦门同安区四区域调整为低风险 全市无中高风险地区
- 直径2米“面气球”亮相 山西首届“寿阳味道”美食大赛启幕
- 世界第一埋深高速公路隧道大峡谷隧道出口端斜井掘进完成
- 浙南沿海村村发展有妙招 搭乘共富快车打造“海上花园”
- 新疆霍尔果斯两例无症状感染者新冠病毒均属德尔塔变异株
- 南沙港铁路国庆假期不停工 力争今年年底开通
- 添加陌生人为好友 内蒙古两女子被骗126万
- 中国国庆假期出行热:数字改变“关键小事”
- 水能载物亦能“生金” 浙江遂昌山村以水为媒奔共富
- 铁路人国庆雨中巡查排险记:一身雨衣、一把铁锹保安全畅通
- 铁路迎返程高峰 西安局集团公司加开79趟高铁列车
- 受热带低压影响 琼州海峡北岸等待过海车辆排长龙
- 哈尔滨市学校有序恢复线下教学
- 哈尔滨一地风险等级调整为低风险
- 从进“培训班”到看《长津湖》
- 安徽黄山国庆假期迎客12万余人 旅游市场稳步复苏
- 山西解除持续近90小时的暴雨四级应急响应
- 科学拦峰错峰削峰 嘉陵江洪水过境重庆中心城区“有惊无险”
- 粤高速大湾区路段假期车流集中 跨珠江口通道尤甚
- 千年街区“非遗”风催热国庆假期本地游
- “颜值担当”里的中国,映照“万物和谐”新气象
X 关闭
资讯
X 关闭
行业动态
-
老牛湾长城:四代人的接力守望|观天下
- 老牛湾长城:四代人的接力守望|观天下
- 四川内江东兴:一株天冬带动中医药大健康产业蓬勃发展-全球今日讯
- 全球焦点!白萝卜怎么炒好吃家常做法大全
- 全国公共体育场馆开放使用典型案例名单公布,山东这家单位上榜
- 天天头条:从“绿色制造”到“智造绿色”:一个厂区的绿色转型
- 最新:辽宁省营口经济技术开发区临港工业区管委会走访中州期货
- 内蒙古阿拉善盟额济纳旗2023-05-15 08:57发布大风蓝色预警
- 阿里(BABA)达摩院自动驾驶团队全部并入菜鸟集团 从科技探索转入场景落地-天天看热讯
- 全球快资讯:我市25所学校榜上有名
- 环球快讯:港股异动 | 招金矿业(01818)涨超4%领涨黄金股 美国通胀继续降温但债务担忧升温 加息或临尾声关注黄金配置机会


