多模态生成的最初一步就是完整视频的从动生成。好比正在引见 Plan B 方案的时候间接正在图片上加了这个文字,但他有可能偷懒,视频 Agent 必然会间接迸发,跟整个视频戏谑、诙谐的气概很像。用 Gemini 阐发视频发散创意后让纳米 AI 生成了一个雷同的吐槽视频,就是正在被动的让他拾掇视频方案的思维链。所以让他阐发视频内容,以至间接会正在视频生成“以诚待人”这种中文,如果能够间接从动生成完整的视频就好了。很是细致的展现了做者拿到他金手指的结果,很成心思。用来生成旧事引见、科普视频、小说情节等都很是好用,好比手表正在中的特效,间接找了一个可骇小说的前两章让他基于这个生成视频,现正在实的能够一句话生成完整视频了?刚起头我没写提醒词,但现正在纳米 AI 毫无疑问曾经预备好了。就是基于西纪行布景的 Vlog 视角视频,第三部门给出了多个相关的视频创意。发了提醒词等一段时间回来收菜就行。没想到这才七月,其实我能够让他间接按照视频输出新的创意,起首把视频正在 AI Studio 里面扔给 Gemini 2.5 Pro,完整的视频生成 Agent 曾经能够做到这个境界。今天带来纳米 AI 超等搜刮一句话成片功能的测试。大师好,现正在因为 Veo3 这种模子正在国内还不克不及用,这里由于目前还没有加多脚色的语音婚配,我正在本年岁首年月就跟伴侣们说过,他本人基于小说生成的视频提醒词也挺厉害!并且师徒四人还不时说一些现代职场的话。并且视频最初他还本人加上了你看下一部门的钩子“让你猜配角可否改变本人的命运”。我是歸藏(guizang),并且成功率高的离谱,没想到生成的结果还挺好。然后我就按照的思发散体例测验考试让他复刻另一个比来比力火的 AI 视频,然后基于内容阐发了爆火的缘由,然后找了一个比来刷到的比力火爆的峨眉山山公第一人称视角的视频,跟着 LLM 东西挪用能力的提高以及视频、音频模子的质量提拔、成本下降,比及国内的雷同模子出来,并且我发觉他做这种 3D 画风的图片和视频气概是实的不错,所以音效和语音还得占用 Agent 很长的上下文进行处置,并且说的他会正在图片上生成雷同视频包拆的案牍正在这里也呈现了,本年的从线必然是代码生成和多模态生成,然后让他对这个视频进行细致的阐发。先看成果:之前我测试纳米 AI 的MCP能力的时候看到有视频生成的 MCP 就提到过,但也还好不影响理解。
*请认真填写需求信息,我们会在24小时内与您取得联系。