Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入
时间:2023-08-24 07:04:10来源:站长之家


(资料图片仅供参考)

编程客栈()8月23日 消息:最近, Hugging Face 推出了一个名为 IDEFICS 的开源多模态 AI 模型,它可以接受图像和文本作为输入,并生成连贯的文本输出。

IDEFICS 是一个强大的视觉语言模型,拥有高达800亿的参数量,功能包括根据图像生成描述、回答相关问题以及根据多个图像生成叙述等。

IDEFICS 基于 DeepMind 开发的 Flamingo 模型,后者是一种目前最先进的视觉语言模型,但尚未对外开源。相比之下,IDEFICS 作为 Flamingo 的开源实现版本,其测试结果显示在各类图像理解任务上其表现与 Flamingo 相当。

为训练 IDEFICS,Hugging Face 利用了多种公开的数据集,还额外构建了一个包含1.4亿张图像的大规模图像-编程客栈文本数据集。

IDEFICS 有两个版本,包括90亿参数的基础版和800亿参数的大模型版,可以处理不同的应用场景。

IDEFICS 的推出为研究人员和开发者提供了js一个强大的开源视觉语言编程模型,相比专利系统如 GPT-3,它提供了更大的灵活性。同js时,IDEFICS 也显示出生成式模型处理多模态输入的潜力。

未来如果能进一步提升多模态理解和生成能力,将可以大幅推动诸如机器人、自动驾驶等多模态 AI 应用的发展。

项目网址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

标签:

生活指南
  • 传奇战士四十级衣服_传奇战士四十级衣服怎么获得

    传奇战士是一款非常受欢迎的手机游戏,其中四十级衣服是非常重要的装备

  • 贴片led灯珠电压电流是多少 贴片led灯

    1、用万用表的二级管档测,红笔接正,黑笔接负。2、如果有蜂呜声则坏,

  • “枫桥式人民法庭”创建丨“码上法庭”来啦!

    为持续深化“枫桥式人民法庭”建设,探索人民法庭参与基层社会治理的新

  • 证券公司电话提示风险(证券公司电话)

    大家好,小问来为大家解答以上问题。证券公司电话提示风险,证券公司电

  • 科学技术改变世界

    科学技术改变世界——读《这就是中国科学家》有感暑假期间,妈妈给我买

  • ​中国人寿潢川支公司开展消防安全知识培训 环球速看料

    当下正值高温天气,为加强公司消防安全管理工作,提升消防安全管理水平

  • 杭州豪车坟场有人去拿吗 杭州又现“汽车坟场”?街办回应 基本情况讲解

    1、杭州豪车坟场有人去拿吗2、杭州又现“汽车坟场”?街办回应3、以上

  • 京东白条还不上贷款会有什么后果

    网贷逾期一般会上征信,有些借贷机构在用户逾期后一天后就会上报给征信

  • 劳斯莱斯发布逐影 售价超过1.86亿

    劳斯莱斯近日发布了全新定制车型——逐影,这款车经过四年的精心打造,

  • 颁奖晚会成功举行,2023年“文化中国•水立方杯”中文歌曲大赛圆满收官

    相聚北京,相约再见颁奖晚会成功举行8月8日晚,2023年“文化中国·水立

  • 公安部:10月31日前主动上缴非法枪爆物,将从宽处理

    公安部:10月31日前主动上缴非法枪爆物,将从宽处理---公安部8月22日在

  • 全民投资人有效兑换码 10个长期可用激活码

    在全民投资人这款游戏中兑换码的数量是有很多的,里面的奖励也非常的丰

  • 宝洁旗下海飞丝洗发水发现虫卵

    北京商报讯(记者张君花)8月22日,有消息称,湖北黄石一位消费者反映,

  • 辽宁省政协人口资源环境委员会原副主任朱京海被双开

    8月21日(发布时间),辽宁省政协人口资源环境委员会原副主任朱京海被

  • 锦旗界的“显眼包”来了,就是那么6!

    近日胡先生(化名)带着一面锦旗来到佛山南海公安分局罗村派出所打开锦

  • “80后”国家部委干部竟是美国间谍!详情披露

    近日,国家安全机关破获一起美国中央情报局间谍案。犯罪嫌疑人郝某,19

  • 民生
    • 重大突破!西延高铁全长5730米道镇隧道顺利贯通

    • 8月23日24时 油价或迎“五连涨”

    • 今年以来新股发行募资3044.20亿元 科创板占比43.43%

    • 什么水果补水效果最快最好