西索的寻苹果之旅今年政府工作报告提出,要大力推进现代化产业体系建设,加快发展新质生产力。其中提到要深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。
“通用人工智能产业发展22条”发布不久,广东做出“加快培育人工智能等新兴产业,大力发展新质生产力”的新年部署。南都大数据研究院今年开展“粤来粤AI”大型研究,将以多个篇章描摹发展现状,考量应用实效,研判治理风险,助力广东加快建设通用人工智能产业创新引领地,协同探索人工智能监管模式创新。本次推出“有AI应用篇”系列报道,走访广东人工智能相关企业,揭秘那些与我们工作生活息息相关的AI应用产品的研发故事。
第二期,走进深圳市前海手绘科技文化有限公司,看AI如何为数字相框赋予灵魂,在中东市场成为爆款。
想不到,一款会说话的AI数字相框,竟在中东成了爆款。只需上传一张人像照片和一段声音素材,就能生成相框里的数字人,他/她不仅能克隆你的声线多种语言,和用户无障碍交流。
这款相框来自深圳的一家AIGC品牌——来画,可应用在展馆导览、亲情陪伴、逝者悼念等场景。今年以来,该品牌已亮相于广东省高质量发展大会产业科技融合发展成果展、2024沙特阿拉伯通信科技与信息技术展览会等国内外多个展会。
可运用于政务/金融/医疗等场景的服务助手,博物馆、文化馆、展览馆等讲解助手,陪伴空巢老人、悼念逝者、传递哀思等。
增强讲解趣味,为用户提供相关资讯及个性化服务,可全天候、全方位地与受众进行实时互动。
“AI相框的灵感来自于迪拜的金像框,配合着AI数字人的生成技术,你可以跟世界上任何一个人对话,这个创意将哈利·波特电影中会说话的相框复现了”,来画创始人魏博介绍,中东国家有将尊贵人士照片挂在墙上的文化习俗,这一市场潜力被来到沙特拓展业务的他敏锐捕捉到,AI相框由此诞生。
定位于“好看的皮囊,有趣的灵魂”,但AI相框起初只能实现简单的特效,“皮囊并不智能”。在魏博看来,ChatGPT 的诞生真正为AI相框赋予了灵魂,通过绑定APP并上传相应素材,就能够实现和相框人物对话、生成视频等功能,目前可支持50多种语言。在国外,一些足球俱乐部将内马尔、C罗等球星的AI数字人相框放进球迷商店售卖,受到了“疯抢”。
来画联合创始人全倖慧告诉南都记者,AI相框是公司在中东打响的“第一炮”,她也惊讶于整个中东地区的阿拉伯人对于“相框”的文化寄托和情感寄托。据了解,这款AI数字相框在海外已经售卖了上万台,不仅挂入了阿布扎比皇宫,还作为国礼被皇室馈赠给远道而来的贵客。
“它更像是一个AI助手的角色”,接受采访时,全倖慧更愿意将AI相框定义为基于技术驱动的消费电子产品。将Al助手SDK运用集成到不同硬件中,就能实现对多行业智能交互场景的连接。
不仅可以做成“相框”,AI助手还能化身咖啡厅点单员、博物馆讲解员、企业前台等,在政务、金融、医疗等场景进行答疑解惑,在博物馆、文化馆、展览馆等场景开展科普教育,成为陪伴空巢老人的心灵伴侣、悼念逝去亲人的媒介等等。南都记者注意到,来画的AI助手已被应用于COP28联合国气候变化大会IP助手、阿布扎比大清真寺AI导览助手、阿布扎比警察局官网AI助手、阿布扎比咖啡厅点单助手等案例中。
全倖慧谈到,在文化领域,AI助手也能被应用于与孔子、鲁迅、蒙娜丽莎、爱因斯坦等古今中外名人跨时空对话的场景,像《长安三万里》李白的动画形象登上了今年的春晚舞台,来画也借机推出了李白形象的AI助手,用户可与其吟诗对谈,进行有趣互动。
今年1月,来画发布了2023年度报告,AI动画、AI数字人视频、AI助手、AI相框成为产品核心关键词,不难看出,“AI创作”已成为该品牌的内核。
起初来画的定位并非AIGC,而是希望传递“让视频创作更加简单”的理念。2015年,来画所属“深圳市前海手绘科技文化有限公司”创立,“我们早期并没有推崇AIGC,之所以一步步发展成为AI公司,源于我们持续将小的AI功能植入到产品中去赋能用户”,全倖慧透露,公司创立的早期想法是去打造动画技术,研究动画的自动手绘路径,基于动画智能生成平台不断迭代用户体验,将自定义IP卡通形象等功能植入到产品中,用户可以创建角色并驱动其讲话,这也是早期的数字人技术。
随着数字人的出圈,来画科技开始大规模雇佣画师,手绘出一个个数字人IP模版。据全倖慧介绍,来画的驱动技术可以做到通过上传一张照片,连接到手机APP后远程操控数字人形象,从而生成数字人口播视频、数字人动画、数字人直播等等。“如今的来画科技已蜕变为一个AI创作平台。”全倖慧说。
2023年,人工智能迎来“奇点”:大语言模型ChatGPT横空出世,“生成式AI”形成奔涌大潮,几乎每天都有新的生成式AI产品诞生。乘着东风,来画依托自身1800万动画数据资产,推出动画领域的垂直模型SkinSoul,这成为平台智能内容创作与交互体验能力的驱动器,由此支撑着视频、动画创作。
譬如,用户使用平台推出的商业视频制作工具URL TO VIDEO,将亚马逊、淘宝等网页链接导入后,就能快速批量化生成多种不同风格的视频,且可以在Al动画在线创作平台进行简单拖拽等二次编辑,生成动画视频。目前,该功能已被在线教育、媒体宣传、广告营销、金融、医疗等行业使用,比如帮助教师将课程内容一键转换成相关的视频,快速制作出生动的课件,再配以数字人去做讲解,提升授课的趣味性和效率;再如,赋能电商运营,帮助中小企业提升营销能力和体验;还有帮助医生制作科普视频等等。
8年多时间里,来画科技已积累起3000万+动画数据资产,这成为训练模型的原料。全倖慧指出,在大模型研发方面,来画选择与基于开源大模型进行应用层的训练,并针对不同大模型生成的效果进行测试。
目前,来画与大模型创业公司月之暗面展开了合作,基于大模型Kimi去进行“可控视频”的生成训练,从而达到内容与画面的强匹配。据悉,Kimi见长于长文本处理能力,可以从复杂和冗长的文档中迅速提取关键信息。Kimi智能助手支持输入20万汉字,按OpenAI的计算标准约为40万token(模型可以理解和生成的最小意义单位),是彼时全球大模型产品中所能支持的最长上下文输入长度。
“这些所生产出来的,不管是里面运用的背景素材也好,还是被运用的这些数字人也好,它们皆是正版可商用的”,全倖慧强调。
对于来画而言,带着“AI相框”走出国门成为品牌发展的重大转折。以沙特、阿联酋、卡塔尔、科威特等为代表的诸多中东富裕国家,均已部署各类“2030远景”,从能源型国家向多元化、数字化国家转型,在一次海外市场调研中,来画敏锐捕捉到了商机。
2022年以来,该公司开始关注中东市场,并将阿联酋作为落地的首站,成立阿布扎比中东总部,出海拓展全球商业版图。其推出的海外动画产品Doratoon、海外数字人产品InnAIO均受到广泛关注,也带来了覆盖全球100多个国家和地区的数千万用户。去年以来,来画的产品在土耳其国家峰会、GITEX GLOBAL 2023全球科技盛会、沙特LEAP科技展等海外知名活动上相继亮相,并与迪拜中阿卫视等众多机构企业达成AI数字人合作。
“参加这些展会时,我们的AI相框常被‘疯抢一空’,因为文化属性不同,会出现不同的需求,形成出其不意的‘爆款产品’”。谈及下一步产品规划,全倖慧表示,在拓展海外市场时会较早地认知到海外的AI行业趋势,也会及时将这些信息带到国内,赋能下一步的产品研发方向。
|