教人工智能以“我”的视角看世界
为了让人工智能系统像人类一样与世界互动,人工智能领域需要开发一种全新的比较好人称感知范式。这意味着当人工智能实时移动和交互时,它应该从比较好人称的角度理解日常活动。
世界是多维的,生活中同样的风景,从不同的视角看会呈现不同的形态。要让人工智能更像人类,就要让它的视角更接近人类。站在人类的角度,人工智能可能会看到一个新的世界。
近日,由脸书和9个国家的13所大学和实验室组成的学术联盟宣布,11月,开源将使人工智能拥有以比较好人称视角与世界互动的能力的Ego4D(以自我为中心的4D感知)项目。这个项目包含超过3025小时的比较好人称视频,涉及来自73个城市的700多名参与者的日常生活。这些视频将有助于让人工智能认知世界的方式更加人性化。
那么,目前人工智能用什么视角来认知世界,不同的视角会对人工智能的认知环境产生什么影响?人工智能用什么技术来感知环境和世界?想要更像人类一样认识世界,人工智能需要突破哪些瓶颈?
人工智能通常采用第三人称视角。
“要让人工智能系统像人类一样与世界互动,人工智能领域需要发展一种全新的比较好人称感知范式。这意味着当人工智能实时移动和交互时,它必须以比较好人称视角理解日常活动。”脸书的首席科学家克里斯蒂安·格劳曼曾经说过。
今天的计算机视觉系统大多使用数百万张从第三人称视角拍摄的照片和视频进行学习。“为了建立新的感知范式,我们需要教会人工智能像人类一样,以比较好人称视角,即‘我’的视角来观察和理解世界,并与之互动。这种认知方式也可以称为自我中心认知。”10月26日,王源智库人工智能处处长、图灵机器人首席战略官谭宇舟在接受科技日报记者采访时指出。
如何理解人工智能的比较好人称和第三人称视角?谭明洲解释说:“比较好人称视角代入感很强。比如玩游戏,如果你在那里,你看到的游戏画面就是你在现实世界看到的画面。第三人称视角也叫神视角,就好像你一直在角色周围飘,你可以看到角色本身和周围的情况。比如以第三人称的视角,躲在掩体后可以看到掩体前的情况;在比较好人称视角下,由于视角范围的原因,在掩体后面只能看到掩体本身。”
“再比如自动驾驶。如果它的视觉系统只是收集旁观者的数据(比如汽车的角度),即使是通过几十万张旁观者视角的车辆行驶图像或视频进行训练,人工智能可能还是不知道怎么做,很难达到目前的自动驾驶水平。因为这种旁观者的视角和坐在车内方向盘前的视角有很大的不同,所以从比较好人称的角度来看,真正的驾驶员的反应还包括刹车、猛踩等行为,这是旁观者的视角无法收集到的。”谭玉舟进一步说道。
“过去人工智能社区很少从比较好人称视角收集数据集,这个项目弥补了人工智能视角系统的不足。AR和VR的未来发展很重要。如果人工智能能够以‘我’的视角观察和理解世界,将开启人类和人工智能沉浸式体验的新时代。”谭玉舟指出。
克里斯汀·格劳曼(Christine Glaumann)还表示:“下一代人工智能系统需要从一种完全不同的数据中学习,即从以事件为中心的视觉而不是边线视觉展示世界的视频中学习。”
建立真实世界的数据集
目前人工智能感知环境、认识世界、建立类人认知系统的主要方式有哪些「动手」?
行业专家指出,历史已经证明,基准和数据集是人工智能行业创新的关键催化剂。今天,几乎可以识别图像中任何对象的计算机视觉系统都是基于数据集和基准的,这为研究人员提供了一个研究真实世界图像的实验平台。
“脸书前几天发布的项目,其实本身就是建立数据集,旨在训练人工智能模型更像人类。它围绕比较好人称视觉体验开发了五个基准挑战,即将比较好人称视角拆解为五个目标,并进行相应的训练集竞赛。”谭玉舟指出。
Ego4D的五个基准是:情景记忆,什么时候发生?预测,接下来我可能要做什么?手物交互,我在做什么?视听日记,谁在什么时间预测(数据为往年仅供参考)说了什么?社交,谁在和谁互动?
谭明洲强调,上述基准测试将推动开发人工智能助手所必需的构建模块的研究。人工智能助手不仅可以理解现实世界中的指令并与之交互,还可以理解元宇宙中的指令并与之交互。
为了建立这个数据集,与脸书合作的大学团队向研究参与者分发了现成的头戴式相机和其他可穿戴传感器,以捕捉比较好人称未经编辑的日常生活视频。该项目的重点是参与者从日常场景中捕捉视频,如购物、烹饪、玩游戏时聊天以及与家人和朋友的其他集体活动。
该视频捕捉了相机佩戴者在特定环境下选择观看的物体,以及相机佩戴者如何以自我为中心的视角与人和物进行互动。到目前为止,相机佩戴者已经进行了数百次活动,并与数百个不同的对象进行了互动,该项目的所有数据都是公开的。
“对脸书的这项研究可以加速人工智能领域以自我为中心的认知研究的进展。这将对我们未来的生活、工作和娱乐方式产生积极影响。”谭玉舟说。
让人工智能的认知能力更加人性化。
人工智能发展的最终目的是造福人类,使我们能够应对现实世界日益复杂的挑战。想象一下如何通过AR设备在琴棋书画课堂上准确地弹琴、下棋、握笔、画轮廓。生动地指导家庭主妇根据食谱烘烤和烹饪菜肴;健忘的老人借助眼前的全息图回忆过去...
脸书强调,希望通过Ego4D项目为学术界和行业专家开辟一条全新的道路,帮助构建一个更加智能、灵活、交互的计算机视觉系统。随着人工智能对人类日常生活方式有了更深入的理解,相信这个项目可以以前所未有的方式将人工智能的体验情境化和个性化。然而,目前的研究仅仅触及了自我中心认知的皮毛。
怎样才能让人工智能的认知能力更像人类?“首先是关注。人工智能的注意力机制更接近直觉,而人类的注意力是有选择性的。目前人工智能的注意机制大多是在训练过程中反复告诉人工智能哪些地方需要注意,哪些事情是相关的。未来,参与实验的人可能会被允许佩戴可以捕捉眼球的特殊设备,以进一步收集相关数据。”谭玉舟指出。
“其次,我们需要通过关注事件和行为之间的关系来定义人工智能的行为。一件事的发生包括多种行为,人工智能系统要通过人类的反馈来训练,使人工智能的行为与我们的意图一致。”谭玉舟进一步表示。
谭明洲强调:“此外,听觉与视觉、语言与行为之间需要合作、响应和联动,这就需要构建多模态的交互模型,深入研究视角为什么聚焦投资,并与意向认同相结合,形成与行为的联动机制。”(记者华凌)
【纠错】本文地址:https://www.55jiaoyu.com/show-270939.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦
热门文档
- 1.朔州市二中(朔州市二中2022中考录取分数线预测(数据为往年仅供参考)预测)
- 2.粮食工程专业就业方向及前景!附2025大学排名及分数线预测(数据为往年仅供参考)
- 3.广州市公用事业技师学院(广州市公用事业技师学院金盘岭校区)
- 4.武汉江南技术学校(武汉市青山区江南技术学校)
- 5.中山医(中山医科大学***附属医院)
- 6.龙冈中学(龙冈中学录取分数线预测(数据为往年仅供参考)预测2022)
- 7.可模仿的世界名画100幅人物可模仿的世界名画100幅人物男_...(少女世界名画人物肖像)
- 8.砚眼文言文翻译(砚眼文言文翻译仆人的错误用一个成语概括)
- 9.双刀歌词双刀歌曲(双刀歌词歌词是什么意思)
- 10.2025新高考八省联考填报志愿模拟演练入口:附填报方式、时间预测(数据为往年仅供参考)
推荐文档
- 11.2023年青岛电子学校招生录取分数线预测(数据为往年仅供参考)
- 12.三顾茅庐的顾什么意思(三顾茅庐中的顾是什么意思这个成语的意思是什么)
- 13.什么叫做淡季(什么叫做淡季和旺季)
- 14.形容流口水的成语(形容流口水的成语望闻生津)
- 15.KurtCobain为什么自杀(kurtcobain为什么自杀)
- 16.值机柜台是什么意思(值机柜台是什么意思F06-H10什么意思)
- 17.地球赤道一圈多长(地球赤道一圈多长广州,北京,航程)
- 18.如何报考大学生村官(怎么考村官大学生村官怎么考)
- 19.猪的英语怎么读(猪的英语怎么读,单词怎么写)
- 20.宰相是几品(宋代宰相是几品)
- 21.梦到和婆婆吵架预示着什么(梦到和婆婆吵架预示着什么周公解梦)
- 22.商学是什么专业(目前热门专业十大最吃香专业)
- 23.新冠肺炎的全称是什么(新冠肺炎的全称是新型冠状病毒肺炎)
- 24.坤位是什么方向(大六壬入门基础知识教程)
- 25.江西中考成绩怎样查(江西中考成绩怎么查询2021)
- 26.开头的四字成语(集合16篇)(开头的四字词语有哪些)
- 27.容身之地什么意思(容身之地的容是什么意思)
- 28.段开头的成语接龙(段开头的成语接龙大全集最长)
- 29.寻觅的作文10篇(寻觅的作文10篇三年级)
- 30.皖l是安徽哪个城市的车牌代码(皖l是安徽哪个城市的车牌)
- 31.更多音字组词(更多音字组词和拼音怎么写)
- 32.皖南事变发生在什么时候(皖南事变发生在什么时候开始)
- 33.形容一个人有钱的四字成语(形容一个人有钱的四字成语有哪些)
- 34.第二个字是争的成语(第二个字是争的成语有哪些)
- 35.范睢念ju还是sui(睢盱读suixu还是huixu)
- 36.布达拉宫简笔画布达拉宫简笔画图片儿童(布达拉宫简笔画又好看又漂亮)
- 37.纸上谈兵指的是谁(纸上谈兵指的是谁指鹿为马指的是谁乐不思蜀指的是谁)
- 38.少先队入队仪式新生代表演讲稿10篇(新少先队员入队仪式发言稿)
- 39.虎皮鹦鹉寿命多少(虎皮鹦鹉的寿命一般是多少年)
- 40.禅悟是什么意思(禅悟人生修心修行人生感悟)
- 41.生活在意大利的华人告诉你,意大利移民到底好不好(如今意大利移民的问题很严重吗)
- 42.朝花夕拾优美段落摘抄10篇(朝花夕拾优美段落摘抄10篇50字)
- 43.过年春节的画怎么画过年春节的画怎么画简单好看(2021春节画怎么画简单又好看)
- 44.形容互相支援的成语(比喻互相支持互相帮助的成语)
- 45.达尔文_三字歌谱_乐谱_(达尔文这首歌的歌词)
- 46.whole(wholeheartedly)
- 47.河南高考分数线预测(数据为往年仅供参考)2025一本、二本、专科一览表
- 48.山西2025年高考录取分数线预测(数据为往年仅供参考)一览表(含本、专科批)
- 49.西南科技大学教务系统登录入口(西南科技大学教务系统登录入口网址)
- 50.安阳师范学院教务处登录入口(安阳师范学院教务处登录入口官网)
- 51.輲车是什么意思輲车的解释是什么(notch×herobrine车)
- 52.上海黄浦区有多少平方公里(上海黄浦区占地面积是多少平方千米)
- 53.brick是什么意思brick的翻译(bricks是什么意思英语翻译)
- 54.龟缸怎么处理龟便
- 55.四书是指什么五经是指什么
- 56.结婚彩礼钱法律上归谁
- 57.成龙代言佳能什么型号
- 58.红酒要醒多久才好喝
- 59.婚姻料理电视剧情
- 60.人生只若如初见的意思
- 51.长岛水产职业中等专业学校往年报名条件、招生要求、招生对象
- 52.新华全媒+|番茄立体栽培 来看智慧温室里的“黑科技”
- 53.产业经济现4个破万亿,上海加快布局新赛道
- 54.全球连线|******“零碳”供暖城市供暖季结束
- 55.无棣县职业中等专业学校的院校办学层次是什么
- 56.国家计算机病毒应急处理中心监测发现15款违法移动应用
- 57.这项技术提升超高分子量聚乙烯产能10倍以上
- 58.网盘“月考”,年底前能解除限速吗?
- 59.柔性智能:工业机器人演进分水岭
- 60.首批新能源汽车电池退役潮来了 回收企业却“吃不饱”?
- 61.国企数字化转型跑出“加速度”
- 62.乡村振兴要用好“数字红利”
- 63.“智慧社区”带来宜居新生活
- 64.筑牢反电信网络诈骗防护网
- 65.快步迈向数字乡村的春天
- 66.莱芜技师学院优势有哪些
- 67.招远第三职业中专2023年报名条件、招生要求、招生对象
- 68.***移动总经理董昕:5G行业应用落地超5000个
- 69.标准化为智慧城市建设铺平赛道
- 70.四川盐源职业中学是公办吗

