“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
现在随着各个平台进入稳定期,被称为“全厂希望”的视频号成为无数品牌寻找新增量的重点平台,希望成为下一个“视品牌”。
此外,有道还推出了虚拟人口语私教 Hi Echo2.0和有道速读,用于帮助学生提升英语口语能力和快速理解文档内容。
BakLLaVA是使用LLaVA1.5架构增强的Mistral7B基础模型,具备更好的性能和商用能力。BakLLaVA在多个基准测试中优于LLaVA213B,并且可以在某些数据上进行微调和推理。虽然BakLLaVA在训练过程中使用了LLaVA的语料库,不允许商用,但BakLLaVA2则采用了更大的数据集和更新的架构,超越了当前的LLaVA方法,具备商用能力。
值得一提的是,HarmonyOS NEXT系统底座全线自研,彻底摒弃了传统的Linux内核以及AOSP(安卓开放源代码项目)等代码,仅支持鸿蒙内核和鸿蒙系统的应用。