GPT-SoVITS 一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。 020 AI开发平台AI开源项目# AI开源项目# 个性化助手# 人工智能
ScreenAgent 一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。 020 AI开发平台AI开源项目# AI开源项目# ScreenAgent# VLM
EMO EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为... 020 AI开发平台AI开源项目# AI开源项目# AI视频生成# 动态帧过渡
UniEdit UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。 020 AI开发平台AI开源项目# AI开源项目# 文本驱动编辑# 无需调优
TextDiffuser-2 一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。 020 AI开发平台AI开源项目# AI图像生成# AI开源项目# 内容创造
Snap Video 强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表... 020 AI开发平台AI开源项目# AI开源项目# AI视频合成# Transformer架构
美图奇想大模型 提升了视频和图像的生成质量,广泛应用于影像美化、视频剪辑、电商设计、口播视频制作、广告营销和游戏设计等多个领域 020 AI开发平台AI开源项目# AI开源项目# AI视觉模型# 图像生成
HivisionIDPhotos HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求,还提供了人像抠图、底色添加、排版照生成等高级功能 020 AI开发平台AI开源项目# AI开源项目
MinerU 一个功能强大的PDF内容提取工具,通过其多模态内容处理、结构和格式保留、公式识别与转换、干扰元素去除、乱码识别与处理以及高质量解析工具链等主要功能,能够高效地从PDF文档中... 020 AI开发平台AI开源项目# AI开源项目
NotebookLlama Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成 020 AI开发平台AI开源项目# AI开源项目
Reflection 70B https://reflection-playground-production.up.railway.app/ 020 AI开发平台AI开源项目# AI开源项目# Reflection 70B# 内容创作
CodeGeeX 自动代码生成、代码翻译、自动编写注释等功能,支持20多种编程语言 020 AI开发平台AI编程工具# AI Coding Assistant# AI Programming Tool# AI代码生成