中文语料集开源项目
MNBVC:中文语料集开源项目MNBVC数据集(NLP语料数据集)不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据均来源于互联网搜集。目前总数据量7984GB,目标是达到chatGPT的40T数据,目前进度19.96%。
高效准确的ChatGPT检测器和人工智能内容检测器
Whismer, 定制化AI问答助手,轻松训练自己的专业AI,支持上传各种文件格式,支持分享,可实现团队共享专业AI。
Ai宠物版的宠物相机
国内优质的AI生成文章和对话,可自主训练超级助理授权给抖音公众号等
字节跳动版行政助理
全球最大的LLM开源