研究人员教人工智能识别你正在画的草图

菲梦 2023-10-02 阅读:206 评论:0
经过 萨里大学 萨里大学和斯坦福大学的一个团队开发了一种新方法,可以教授人工智能(AI)理解人类线条图(甚至是非艺术家的线条图)。 新模型在识别场景草图方面接近人类的表现水平。 萨里视觉、语音和信号处理中心 (CVSSP)...

经过 萨里大学

萨里大学和斯坦福大学的一个团队开发了一种新方法,可以教授人工智能(AI)理解人类线条图(甚至是非艺术家的线条图)。

新模型在识别场景草图方面接近人类的表现水平。

萨里视觉、语音和信号处理中心 (CVSSP) 和萨里以人为本人工智能研究所 (PAI) 的讲师 Yulia Gryaditskaya 博士表示:“草图是一种强大的视觉交流语言。它有时甚至更具表现力和表达能力。”比口语灵活。

“开发用于理解草图的工具是迈向更强大的人机交互和更高效的设计工作流程的一步。例子包括能够通过绘制某些东西来搜索或创建图像。”

各个年龄段和背景的人们都使用绘画来探索新想法和交流。然而,人工智能系统在历史上一直难以理解草图。

必须教会人工智能如何理解图像。通常,这涉及收集图像中每个像素的标签的劳动密集型过程。然后人工智能从这些标签中学习。

相反,该团队结合使用草图和书面描述来教授人工智能。它学会了对像素进行分组,将它们与描述中的类别之一进行匹配。

与之前的方法相比,最终的人工智能对这些图画表现出了更丰富、更接近人类的理解。它能够正确识别和标记风筝、树木、长颈鹿和其他物体,准确率高达 85%。这优于依赖标记像素的其他模型。

除了识别复杂场景中的对象之外,它还可以识别哪些笔画旨在描绘每个对象。这种新方法适用于非艺术家绘制的非正式草图,以及未经过明确训练的物体图画。

斯坦福大学心理学助理教授朱迪思·范教授表示:“绘画和写作是最典型的人类活动之一,长期以来一直有助于捕捉人们的观察和想法。

“这项工作代表了人工智能系统取得的令人兴奋的进展,它能够理解人们试图传达的想法的本质,无论他们使用的是图片还是文本。”

该研究是萨里以人为本的人工智能研究所的一部分,特别是其 SketchX 项目。 SketchX 利用人工智能,试图通过我们绘制世界的方式来理解我们看待世界的方式。

以人为本的人工智能研究所联合所长、SketchX 负责人宋一哲教授表示:“这项研究是人工智能如何增强素描等基本人类活动的一个很好的例子。通过用接近人类的方式理解粗略的绘图,准确性,这项技术具有巨大的潜力,可以增强人们的自然创造力,无论艺术能力如何。”

该研究已发布到 arXiv 该论文将在 2024 年 6 月 17 日至 21 日在西雅图举行的 IEEE/CVF 计算机视觉和模式识别会议 (CVPR 2024) 上发表。

更多信息: Ahmed Bourouis 等人,开放词汇语义场景草图理解, arXiv (2023)。作者:10.48550/archiv.2312.12463

期刊信息: arXiv

由...提供 萨里大学

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 苹果面临在开发者大会上交付人工智能的压力

    苹果面临在开发者大会上交付人工智能的压力
    作者:格伦·查普曼 预计苹果公司将于下周证明,在科技界的竞争对手在人工智能领域大放异彩之际,它并没有被抛在后面。 分析师称,人工智能,甚至与 ChatGPT 制造商 OpenAI 的合作,都可能成为周一在硅谷举行的苹果年度 WWDC 开发者大会的主题。 这次会议是为苹果生态系统创建应用程序和软件的开发人员举办的年度盛会,首席执行官蒂姆库克将努力说服他们,随着竞争对手微软和谷歌连续快速推出创新,该公司是人工智能的关键参与者。 尽管苹果多年来一直在其 iPho...
  • 法国国家铁路公司 (SNCF) 将在意大利提供高速客运线路

    法国国家铁路公司 (SNCF) 将在意大利提供高速客运线路
    通过安东尼·盖伊 法国国家铁路运营商 SNCF 周三表示,计划从 2026 年起在邻国意大利提供高速客运服务,在其本土与竞争对手 Trenitalia 竞争。 SNCF Voyageurs 城际 TGV(高速列车)服务主管 Alain Krakovitch 表示:“意大利是一个天然的高速列车市场,每年接待 5600 万名乘客。” “但这是一个尚未成熟的市场,仍有许多乘客需要引进。” SNCF 计划最终在都灵、米兰、罗马和那不勒斯之间提供每日 9 趟往返列车...
  • 3D打印的微型执行器可以移动小型软机器人,将它们锁定成新的形状

    3D打印的微型执行器可以移动小型软机器人,将它们锁定成新的形状
    通过马特·希普曼 , 北卡罗来纳州立大学 北卡罗来纳州立大学的研究人员展示了微型软液压执行器,可用于控制厚度不到一毫米的软机器人的变形和运动。研究人员还证明,这项技术适用于形状记忆材料,允许用户反复将软机器人锁定为所需的形状,并根据需要返回到原始形状。 “软机器人技术在许多应用中都有前景,但设计小规模驱动软机器人运动的执行器具有挑战性,”该工作论文的通讯作者、机械和航空航天副教授杰尹说。北卡罗来纳州立大学的工程学。 “我们的方法利用商用多材料 3D 打印技术和...
  • 新的168飞艇官方开奖历史记录查询图形处理技术比现有解决方案显示出显着的速度优势

    新的168飞艇官方开奖历史记录查询图形处理技术比现有解决方案显示出显着的速度优势
    经过168飞艇官方开奖历史记录查询高等教育出版社管理大规模图数据的行业对高效、快速的数据处理工具的需求导致了 GraphCP 的发展,这项技术可以显着提高处理速度。GraphCP不仅满足甚至大大超过了现有图处理系统的性能:这种性能改进使 GraphCP 成为依赖快速高效的图形数据处理的应用程序的领先解决方案。该研究的通讯作者 Yongli Cheng 表示:“GraphCP 在减少冗余数据访问和提高 I/O 带宽利用率方面的进步有助于我们领域的发展。”凭借其增强的速度,Gra...
  • 四足狗形机器人幸运飞行艇168官方开奖在人迹罕至的环境中“嗅探”有害气体

    四足狗形机器人幸运飞行艇168官方开奖在人迹罕至的环境中“嗅探”有害气体
    经过 美国化学会噩梦材料还是真正人类最好的朋友?幸运飞行艇168官方开奖一组研究人员为一个像狗一样的四足机器人配备了机械臂,可以从潜在危险的情况下采集空气样本,例如废弃的建筑物或火灾。在《2019》上发表研究的团队表示,机器狗会将样本带到一个人面前,由他筛选样本中是否存在潜在危险的化合物。 分析化学 。虽然该系统需要进一步完善,但演示显示了其在危险条件下的潜在价值。对于科学家和技术人员来说,在危险工作场所或火灾等事故后测试空气中的危险化学品是一项重要但非常危险的任务。为了...