首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
位置: 首页 > 实时讯息 >

腾讯混元宣布开源定制化图像生成插件InstantCharacter

0次浏览     发布时间:2025-04-18 19:26:00    

IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。

腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方

输入原始图片

+ prompt :a rabbit is in the kitchen holding a spoon and drinking soup

就能得到下面的图:

+prompt:a rabbit in the city,cyberpunk

就可以得到:

角色一致性是多轮文生图场景中的一大难题。InstantCharacter 的优势在于可以确保角色在不同场景中的一致性和真实性、画质和精度高,同时具有灵活的文本编辑性,用户可以根据需要灵活切换任意场景,让人物生成任意动作。

其在角色一致性和图像生成的精确度上号称超过了此前业界的相关技术,能够处理多种风格和复杂度的图像。

通过这个插件,内容创作者可以让生成的角色保持高度一致,能够更高效地创作出符合其需求的视觉作品,可以用于连环画、影片创作等场景

实际的测评中,开源的 InstantCharacter 实现的效果媲美 GPT 4o 等模型。

从技术上看,现有基于学习的方法主要依赖于 U-Net 架构,但在泛化能力和图像质量上存在局限性,而基于优化的方法则需要针对特定主体进行微调,这不可避免地降低了文本可控性。

为了解决这些挑战,InstantCharacter 利用 DiT 模型构建了一个创新的框架。框架引入了一个可扩展的适配器(adapter),采用多个 transformer encoder,能够有效处理开放域的角色特征,并与现代扩散变换器的潜在空间无缝交互。这种设计使得系统能够灵活适应不同的角色特征。

同时,为了有效训练框架,腾讯混元团队还构建了一个包含千万级样本的大规模角色数据集。数据集被系统地组织为成对(多视角角色)和非成对(文本-图像组合)子集。这种双数据结构使得身份一致性和文本可编辑性能够通过不同的学习路径同时优化。

IT之家附项目相关链接:

  • 项目官网:https://instantcharacter.github.io/

  • 代码:https://github.com/Tencent/InstantCharacter

  • Hugging Face Demo:https://huggingface.co/spaces/InstantX/InstantCharacter

  • 论文:https://arxiv.org/abs/2504.12395

相关文章

出台装备制造相关行业新一轮稳增长方案、电信业进一步扩大开放!工信部谈下阶段工作重点

4月18日,国新办举行新闻发布会,工业和信息化部有关负责人介绍2025年一季度工业和信息化发展情况。一季度规模以上工业增加值同比增长6.5%,增速比去年四季度加快0.8个百分点。一季度,工业对宏观经济增长的贡献率达到了36.3%。工业民间投资保持两位数增长,企业预期提振、效益改善,规模以上工业企业数

2025-04-19 02:01:00

腾讯混元宣布开源定制化图像生成插件InstantCharacter

IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。输入原始图片+ prompt :a ra

2025-04-18 19:26:00

谷歌安卓16揭秘:勿扰模式快捷开关即将回归

IT之家 4 月 18 日消息,科技媒体 Android Authority 昨日(4 月 17 日)发布博文,报道称谷歌计划在安卓“快速设置”(Quick Settings)面板中,重新添加一个快捷开关,专门用于切换“勿扰模式”(Do Not Disturb)。安卓系统此前支持用户通过“快速设置”

2025-04-18 12:16:00

工信部:国产大模型发展创造“中国速度”

【通信产业网讯】4月18日,国务院新闻办公室举行2025年一季度工业和信息化发展情况发布会,工信部总工程师谢少锋,新闻发言人、运行监测协调局局长陶青,信息通信发展司司长谢存出席并答记者问。在回答记者提出的我国人工智能产业的发展形势以及工信部在推动人工智能赋能新型工业化方面取得了哪些进展时,谢少锋表示

2025-04-18 11:20:00

首届酒仙桥论坛在北京数字经济算力中心正式启幕

4月15日,为期6天的2025酒仙桥论坛在北京数字经济算力中心正式启幕。论坛汇聚产学研各界领袖及头部企业代表,聚焦人工智能产业“未来前景、创新应用、生态发展”三大核心领域,探索加快培育新质生产力的实践路径。AI已进入黄金发展期,如何推动AI从技术转化为生产力,是行业内备受重视的议题。在这场以“开启A

2025-04-17 21:53:00

领克03沙丘金配色上市,限时专享价11.68万元起

IT之家 4 月 17 日消息,领克 03 汽车今日宣布第 40 万辆下线,同时推出沙丘金新配色,限时专享价 11.68 万元起。4 月 30 日(含)前下订领克 03 冠军版,限时可享最高价值 2.9 万元的购车福利,包括购车补贴 1 万元、保险补贴 4000 元等。领克 03 配备了一块 15.

2025-04-17 18:55:00

三年5亿!徐汇“揭榜挂帅”破解城市治理难题

4月16日上午,徐汇区“人工智能+城市治理”场景发布暨揭榜挂帅活动在模速空间隆重举行。随着六大AI治理场景的发布和五大赛道揭榜需求的公开,徐汇区以“揭榜挂帅”计划推动技术成果转化,面向全球招募顶尖团队破解城市治理难题。上海市规划和自然资源局党组书记、局长张玉鑫,徐汇区委书记曹立强,区委副书记、区长王

2025-04-17 10:16:00

与“甲亢哥”斗舞的深圳机器人,开售!花18.8万元就可以拥有

会翻跟头,也会跳“斧头舞”,众擎的“网红”机器人正式量产上市。4月15日,证券时报记者查询京东发现,近期在社交媒体上与国际知名网红“甲亢哥”一起“斗舞”的众擎机器人ENGINEAI PM01已经上线平台售卖,售价为18.8万元。此外,众擎还推出了另一款双足机器人产品——众擎ENGINEAI SA01

2025-04-16 06:42:00