Skip to content
View magicyuan876's full-sized avatar
  • 南京

Block or report magicyuan876

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
magicyuan876/README.md

👋 你好,我是 Magic_yuan

Java 程序员 · 拥抱 AI 时代 · 开源贡献者

GitHub followers GitHub stars


🚀 关于我

我是一名 Java 程序员,在企业级应用开发领域有丰富经验。随着 AI 时代的到来,我积极拓展技术边界,学习并实践 Python 在 AI 领域的应用,但内心依然是一个热爱 Java 的开发者。

我相信,无论技术如何变迁,工程思维和架构能力 才是程序员的核心竞争力。我致力于将 Java 的工程化思想与 AI 技术结合,构建可靠、高效的应用系统。

💡 技术栈

核心技能(Java 生态)

  • Java、Spring Boot、Spring Cloud
  • 微服务架构、分布式系统
  • MySQL、Redis、消息队列
  • Maven/Gradle、Docker、K8s

AI 时代的拓展(Python 生态)

  • Python、FastAPI、LitServe
  • PyTorch、Transformers
  • OCR、文档解析、RAG
  • GPU 加速与任务调度

前端技术

  • Vue 3、TypeScript
  • TailwindCSS、Vite

📊 个人项目

🖨️ PrintBridge

Java 打印服务桥接工具

Stars License Java

一个基于 Java 的企业级打印服务解决方案,通过 HTTP API 实现 Web 应用的远程打印功能。

🎯 核心特性

  • 📄 多格式支持:PDF、Word、Excel、PPT、图片等格式一键打印
  • 🚀 HTTP API:RESTful 接口,前端直接调用,无需浏览器插件
  • 🎨 现代化界面:Swing + FlatLaf 美观易用的管理界面
  • ⚡ 高性能:基于 Jetty 服务器 + 线程池,支持高并发打印任务
  • 🔄 格式转换:集成 JODConverter + LibreOffice 实现 Office 文档转换

🛠️ 技术栈

核心技术:Java 8, Jetty 9.4, Maven
打印引擎:Apache PDFBox 2.0
格式转换:JODConverter 4.4 + LibreOffice
界面框架:Swing + FlatLaf
日志系统:SLF4J + Logback


企业级 AI 数据预处理平台

Stars Forks License Python

拥抱 AI 时代的实践项目,一个功能强大的企业级 AI 数据预处理平台,支持多模态数据处理。

🎯 核心特性

  • 📄 文档处理:支持 PDF、Word、Excel、PPT 转换为 Markdown/JSON

    • 集成 MinerU Pipeline(完整解析)
    • DeepSeek OCR(高精度识别)
    • PaddleOCR-VL(109+ 语言支持)
    • 智能水印检测与去除(YOLO11x + LaMa)
  • 🎬 视频处理:支持 MP4、AVI、MKV、MOV 等格式

    • 视频音频提取 + 语音识别
    • 关键帧 OCR(场景检测、质量过滤、智能去重)
    • 多语言、说话人识别、情感识别
  • 🎙️ 音频处理:支持 MP3、WAV、M4A 等格式

    • SenseVoice 引擎多语言识别
    • 说话人识别和分离
    • 情感识别(中性/开心/生气/悲伤)
  • 🖼️ 图片处理:支持 JPG、PNG 等格式

    • 多种 OCR 引擎可选
    • GPU 加速处理
    • 智能水印预处理
  • 🏗️ 企业级特性

    • GPU 负载均衡(LitServe)
    • 任务队列与优先级管理
    • MCP 协议支持(可被 AI 助手直接调用)
    • 现代化 Web 管理界面

🛠️ 技术架构

前端:Vue 3 + TypeScript + TailwindCSS + Vite 后端:FastAPI + LitServe + SQLite AI 引擎:MinerU + DeepSeek OCR + PaddleOCR-VL + SenseVoice

📈 项目亮点

  • ✅ 完整的前后端分离架构
  • ✅ GPU 负载均衡与多 GPU 隔离
  • ✅ 支持 MCP 协议,可与 Claude Desktop 等 AI 助手无缝集成
  • ✅ 实时任务监控与状态追踪
  • ✅ 批量处理与自动重试机制
  • ✅ 模块化设计,易于扩展

🤝 开源贡献

🔥 MinerU - PDF 文档解析工具

Stars

项目简介:由上海人工智能实验室 OpenDataLab 团队推出的开源智能数据提取工具,专注于复杂 PDF 文档的高效解析与提取。

我的贡献

  • API服务实现:主动拉取模式,优化任务调度机制,提升系统性能和可维护性 (08a89ae)
  • 依赖完善:完善 markitdown 依赖管理,确保 Markdown 处理功能稳定可靠 (cedc62a)
  • 代码优化:修复代码审查中提出的问题,提升代码质量和可读性 (e7d8bf0)

技术栈:Python, PyTorch, FastAPI, Worker Pool, 文档解析


LightRAG - 轻量级 RAG 框架

Stars

项目简介:由香港大学数据智能实验室(HKUDS)开发的轻量级检索增强生成(RAG)框架,提供简单高效的 RAG 解决方案。

我的贡献

  • 多轮对话支持:实现多轮对话功能,增强系统的交互能力 (8c121f5)
  • 缓存系统修复:修复缓存处理的运行时错误,提升系统稳定性 (f6d29e1)
  • 异常处理优化:修复异常导致的数据更新卡死问题,确保数据流程正常进行 (443aab2)
  • 断点续传优化:修复断点续传 bug,过滤已存在且处理完成的文档,避免重复处理 (7271ac6)
  • 知识图谱增强:增强知识图谱关系的时序性支持,提升图谱质量 (7b91dc7)

技术栈:Python, RAG, 知识图谱, 对话系统


📫 联系方式


📊 GitHub 统计

GitHub Stats

Top Languages


💬 技术博客与分享

我热衷于分享技术经验和开源项目的开发心得。如果你对我的项目感兴趣,或者有任何技术问题,欢迎通过 GitHub Issues 与我交流!


🌟 如果我的项目对你有帮助,欢迎 Star 支持!

感谢你的关注与支持 🙏

Pinned Loading

  1. mineru-tianshu mineru-tianshu Public

    天枢 - 企业级 AI 一站式数据预处理平台 | PDF/Office转Markdown | 支持MCP协议AI助手集成 | Vue3+FastAPI全栈方案

    Python 148 26

  2. opendatalab/MinerU opendatalab/MinerU Public

    Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.

    Python 48.9k 4.1k

  3. HKUDS/LightRAG HKUDS/LightRAG Public

    [EMNLP2025] "LightRAG: Simple and Fast Retrieval-Augmented Generation"

    Python 23.2k 3.4k

  4. PrintBridge PrintBridge Public

    Java 1