Github 2024-07-01开源项目月报 Top15

简介: 根据Github Trendings统计,2024年7月有15个热门项目。按开发语言分类,项目数量如下:Python项目6个,JavaScript项目3个,C++项目2个,PHP、Blade、非开发语言、C#、Lua、Go、MDX、Jupyter Notebook项目各1个。这些项目涵盖技术重建指南、生成式AI教程、模块化GUI、云平台、数据库系统、视频生成模型、AI框架、Shell提示渲染器、Neovim配置、PDF转Markdown工具及语音识别等多种领域和技术。

根据Github Trendings的统计,本月(2024-07-01统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
JavaScript项目 3
C++项目 2
PHP项目 1
Blade项目 1
非开发语言项目 1
C#项目 1
Lua项目 1
Go项目 1
MDX项目 1
Jupyter Notebook项目 1

从零开始构建你喜爱的技术

这个存储库是一本精心编写的、逐步指南的汇编,可以从零开始重新创建各种技术,如3D渲染器、区块链/加密货币、游戏、操作系统、Web浏览器等。它旨在帮助用户通过理解和构建自己喜欢的技术来掌握编程。

初学者的生成式人工智能(第2版)

《初学者的生成式人工智能(第2版)》是由微软云倡导者提供的一门全面的18课程,教授一切开始构建生成式人工智能应用所需的知识。

ComfyUI:强大而模块化的稳定扩散GUI

  • 创建周期:399 天
  • 开发语言:Python, JavaScript
  • 协议类型:GNU General Public License v3.0
  • Star数量:25663 个
  • Fork数量:2741 次
  • 关注人数:25663 人
  • 贡献人数:90 人
  • Open Issues数量:1263 个
  • Github地址:https://github.com/comfyanonymous/ComfyUI.git

ComfyUI是一个开源项目,提供强大而模块化的稳定扩散图形用户界面(GUI)、API和后端,具有图/节点界面。它允许用户使用基于图/节点/流程图的界面设计和执行高级稳定扩散管道。

Coolify: 开源自助云平台

Coolify是一个开源且可自行托管的替代品,可替代Heroku、Netlify和Vercel等云平台。它可以帮助用户通过SSH连接在自己的硬件上管理服务器、应用程序和数据库,包括VPS、裸金属和树莓派。该平台旨在在使用个人服务器时提供云的便利性,确保没有供应商锁定,并使用户即使停止使用Coolify也能保留对其资源的控制。

DuckDB - 高性能分析数据库系统

DuckDB是一个高性能的分析数据库系统,旨在快速、可靠、便携且易于使用。它提供了丰富的SQL语言方言,支持诸如相关子查询、窗口函数、排序规则和复杂类型等高级功能。DuckDB可作为独立的CLI应用程序使用,并且具有针对Python、R、Java、Wasm等的客户端,与pandas和dplyr等包深度集成。

Open-Sora: 构建自己的视频生成模型

  • 创建周期:17 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1151 个
  • Fork数量:96 次
  • 关注人数:1151 人
  • 贡献人数:6 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/hpcaitech/Open-Sora.git

Open-Sora是一个开源项目,允许用户构建类似于OpenAI的Sora的自己的视频生成模型。它提供了创建自定义视频生成模型所需的工具和资源。

Fabric: 用人工智能增强人类能力的开源框架

  • 创建周期:40 天
  • 开发语言:Python, JavaScript
  • 协议类型:MIT License
  • Star数量:5128 个
  • Fork数量:406 次
  • 关注人数:5128 人
  • 贡献人数:22 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/danielmiessler/fabric.git

Fabric 是一个开源框架,旨在利用人工智能增强人类能力。它提供了将问题分解为组件的哲学,并提供了一种提示的框架方法。该框架包括快速入门指南、设置 fabric 客户端、使用模式、创建 fabric mill、结构、组件、CLI-native 特性、直接调用模式、示例以及主要贡献者的详细信息。

GitKraken制作的高度可定制的Shell提示渲染器

这个项目是一个开源的、高度可定制的、低延迟的跨平台/Shell提示渲染器。它是使用GitKraken制作的,充满了爱。

LazyVim: Neovim配置的懒人方式

LazyVim是由lazy.nvim提供支持的Neovim设置,旨在使用户轻松定制和扩展其配置。它提供了根据需要调整配置的灵活性,同时也提供了预配置设置的便利性。

Marker: 快速准确的PDF转Markdown工具

  • 创建周期:218 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:10397 个
  • Fork数量:502 次
  • 关注人数:10397 人
  • 贡献人数:4 人
  • Open Issues数量:48 个
  • Github地址:https://github.com/VikParuchuri/marker.git

Marker是一个开源工具,可以快速准确地将PDF转换为markdown。它支持各种类型的文档、所有语言,并且可以移除页眉、页脚和其他文档附加信息。此外,它还可以格式化表格和代码块,提取并保存图片,将大多数方程式转换为LaTeX格式。Marker可以在GPU、CPU或MPS上运行。

Transformers.js:网络上的最先进机器学习

Transformers.js 是一个开源项目,可以在网络上实现最先进的机器学习。它允许在浏览器中直接运行 🤗 Transformers,无需服务器。该库在功能上等同于 Hugging Face 的 transformers python 库,并支持自然语言处理、计算机视觉、音频和多模态领域的各种任务。它使用 ONNX Runtime 在浏览器中运行模型,并提供了使用 🤗 Optimum 将预训练的 PyTorch、TensorFlow 或 JAX 模型轻松转换为 ONNX 的功能。

MiniCPM-V 和 OmniLMM: 图文理解的开源多模态大模型系列

  • 创建周期:78 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:861 个
  • Fork数量:49 次
  • 关注人数:861 人
  • 贡献人数:8 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/OpenBMB/MiniCPM-V.git

MiniCPM-V 和 OmniLMM 是面向图文理解的开源多模态大模型系列。它们接受图像和文本输入,并提供高质量的文本输出。MiniCPM-V 2.0 版本能够处理任意长宽比的图像,具有 180 万像素,实现了类似 Gemini Pro 的场景文字识别能力和与 GPT-4V 相当的低幻觉率。OmniLMM-12B 模型在多个基准测试中优于同规模的其他模型,并实现了比 GPT-4V 更低的幻觉率。

视频翻译配音工具


这是一个视频翻译配音工具,可以将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。它支持多种语音识别和文字翻译模型,允许保留背景伴奏音乐,并且支持多种语言。主要用途包括翻译视频并配音、音频或视频转为字幕、批量字幕创建配音、批量字幕翻译、音频、视频、字幕合并、从视频中分离出音频以及下载YouTube视频。它提供了预打包版本和源码部署的详细说明。

StableSwarmUI: 模块化稳定扩散Web用户界面

  • 创建周期:402 天
  • 开发语言:C#, JavaScript
  • 协议类型:MIT License
  • Star数量:3341 个
  • Fork数量:289 次
  • 关注人数:3341 人
  • 贡献人数:17 人
  • Open Issues数量:33 个
  • Github地址:https://github.com/Stability-AI/StableSwarmUI.git

StableSwarmUI是一个模块化的Web用户界面,旨在使强大的工具易于访问,注重高性能和可扩展性。目前处于测试版状态,并计划进行进一步的开发和改进。该用户界面适用于初学者和高级用户,提供主要的生成选项卡界面和舒适的工作流选项卡等功能。该项目欢迎贡献和建议,以增强其功能和功能。

使用Kaldi和onnxruntime的语音识别、文本转语音和说话人识别功能

这个开源项目利用下一代Kaldi和onnxruntime提供了语音识别、文本转语音和说话人识别功能,无需互联网连接。它支持嵌入式系统、Android、iOS、树莓派、RISC-V、x86_64服务器,并与多种编程语言兼容,包括C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript和Flutter。该项目包括语音识别、语音合成、说话人验证、说话人识别、口语语言识别、音频标记、语音活动检测和关键词识别等功能。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
4月前
|
JSON Kubernetes 安全
找到啦,我们已上车,Github 27000+ star,研发团队必备开源工具项目,真丝滑!!!
Trivy 是一款高效灵活的开源安全扫描工具,支持容器镜像、文件系统、Kubernetes 等多目标扫描,具备快速、易用、集成性强等特点,适用于 DevSecOps 全流程安全检测。
220 0
|
3月前
|
人工智能 JavaScript 前端开发
Github 2024-10-28 开源项目周报 Top15
本周GitHub热门项目涵盖Svelte、Open Interpreter、PowerShell等,涉及Web开发、AI助手、自动化工具等领域,Python、JavaScript为主流语言,展现开源技术活跃生态。(239字)
505 19
|
3月前
|
人工智能 JavaScript Docker
Github 2024-11-11 开源项目周报 Top15
本周GitHub热门项目涵盖多领域:Python与TypeScript领跑,包括屏幕截图转代码、本地文件共享、PDF处理、AI开发代理等。亮点项目如screenshot-to-code、LocalSend、OpenHands及Diagrams,兼具创新与实用性,广受开发者关注。
328 13
|
3月前
|
人工智能 Rust JavaScript
Github 2024-10-07 开源项目周报 Top15
本周GitHub热门项目共15个,Python项目占比最高达7个。榜首为Python算法实现集合TheAlgorithms/Python,Star数超17万;其他亮点包括Godot游戏引擎、OpenBB金融平台、ToolJet低代码框架及新兴AI相关项目如Crawl4AI、Llama Stack等,涵盖游戏、金融、AI、理财等多个领域。
188 4
|
3月前
|
人工智能 Rust 算法
Github 2024-09-30 开源项目周报 Top15
本周GitHub热门项目揭晓:Python主导,AutoGPT居首,涵盖AI、编程、数学动画等领域,助力开发者探索前沿技术。
168 4
|
4月前
|
数据挖掘 调度 开发工具
Github 2.3k star 太牛x,京东(JoyAgent‑JDGenie)这个开源项目来得太及时啦,端到端多智能体神器!!!
JoyAgent-JDGenie是京东开源的端到端产品级多智能体系统,支持自然语言生成报告、PPT、网页等内容,准确率达75.15%。具备开箱即用、多智能体协同、高扩展性及跨任务记忆能力,支持多种文件格式输出,部署灵活,不依赖私有云平台。适合企业自动化报告生成、数据分析与行业定制化应用,是高效、实用的开源AI工具。
880 0
|
4月前
|
安全 数据可视化 项目管理
精品,Github 5000+ star,小型研发团队必备商业开源项目
DooTask 是一款开源在线项目任务管理工具,具备文档协作、流程图、任务分发、IM沟通等功能,支持私有部署与数据加密,已在 GitHub 获得 5000+ 星标,适合中小团队提升协作效率。
260 0
|
人工智能 数据安全/隐私保护 计算机视觉
GitHub爆款神器 | IOPaint:21.7k star 开源AI图像修复项目,竟能秒删水印、拓展画幅!
IOPaint 是一款由 Sanster 团队开发的开源图像处理工具,集成多种 SOTA AI 模型,支持图像擦除、对象替换、文本绘制和图像外扩等功能。它操作简便,一键安装,适用于 Windows、macOS、Linux 和 Apple Silicon 系统,适合摄影爱好者、电商从业者及内容创作者使用,大幅提升图像处理效率。
788 0
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
850 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
SQL JavaScript 前端开发
Github 2024-08-05 开源项目周报 Top15
根据 Github Trendings 的统计,本周(2024年8月5日统计)共有15个项目上榜。以下是根据开发语言汇总的项目数量: - Go 项目:4个 - JavaScript 项目:3个 - Python 项目:3个 - Java 项目:2个 - TypeScript 项目:2个 - C 项目:1个 - Shell 项目:1个 - Dockerfile 项目:1个 - 非开发语言项目:1个
614 2