当前位置:首页 > 今日资讯 > 正文

微博互联网科技博主技术性解读Sora:能够创造出充满动感和情绪的***

  2月16日消息,OpenAI发布首个AI视频模型Sora,60秒的一镜到底,神级效果生成。网友纷纷惊呼AI***要变天。

  微博互联网科技博主、前微软Asp.Net最有价值专家、2023微博新锐新知博主@宝玉xp发微博给出对Sora的技术性说明,他表示:

  OpenAI 发布了 Sora,一种文字生成***的技术,从演示看,效果还是相当不错的。

微博互联网科技博主技术性解读Sora:能够创造出充满动感和情绪的视频
(图片来源网络,侵删)

  Sora 的强大之处在于其能够根据文本描述,生成长达 60 秒的***,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。

  例如,基于一段描述时尚女性在东京光影交错的街道上漫步的文本,Sora 能够创造出一段充满动感和情绪的***。街道上的灯光和反射效果,以及人物的装扮和表情,都被生动地展现出来。

  还有更加梦幻的场景,如描述羊毛猛犸象在雪地中前行的文本,Sora 能以其强大的视觉效果,呈现出宁静而壮观的自然景象,动物的细节、背景的雪山和树木,以及光影效果都被精细地捕捉和再现。

微博互联网科技博主技术性解读Sora:能够创造出充满动感和情绪的视频
(图片来源网络,侵删)

  目前,Sora已对网络安全的红队成员开放,以评估其可能存在的风险或潜在伤害。同时,OpenAI 也邀请了视觉艺术家、设计师和电影制作人使用Sora,收集他们的反馈,以使模型更好地服务于创意行业。

  Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令,还能洞察这些元素在现实世界中的表现。

  Sora对语言有着深刻的理解,能够精准地捕捉到用户的需求,并创造出充满生命力、情感丰富的角色。此外,Sora还能在同一***中创造出多个画面,同时保持角色和视觉风格的一致性。

微博互联网科技博主技术性解读Sora:能够创造出充满动感和情绪的视频
(图片来源网络,侵删)

  当然,Sora还不是完美的。比如在模拟复杂场景的物理效应,以及理解某些特定因果关系时,它可能会遇到难题。举个例子,***中的人物可能会咬一口饼干,但饼干上可能看不到明显的咬痕。

  在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;在精确描述一段时间内发生的***,如特定的摄影机移动轨迹时,也可能显得力不从心。