我是一名 Java 程序员,在企业级应用开发领域有丰富经验。随着 AI 时代的到来,我积极拓展技术边界,学习并实践 Python 在 AI 领域的应用,但内心依然是一个热爱 Java 的开发者。
我相信,无论技术如何变迁,工程思维和架构能力 才是程序员的核心竞争力。我致力于将 Java 的工程化思想与 AI 技术结合,构建可靠、高效的应用系统。
核心技能(Java 生态)
- Java、Spring Boot、Spring Cloud
- 微服务架构、分布式系统
- MySQL、Redis、消息队列
- Maven/Gradle、Docker、K8s
AI 时代的拓展(Python 生态)
- Python、FastAPI、LitServe
- PyTorch、Transformers
- OCR、文档解析、RAG
- GPU 加速与任务调度
前端技术
- Vue 3、TypeScript
- TailwindCSS、Vite
🖨️ PrintBridge
Java 打印服务桥接工具
一个基于 Java 的企业级打印服务解决方案,通过 HTTP API 实现 Web 应用的远程打印功能。
- 📄 多格式支持:PDF、Word、Excel、PPT、图片等格式一键打印
- 🚀 HTTP API:RESTful 接口,前端直接调用,无需浏览器插件
- 🎨 现代化界面:Swing + FlatLaf 美观易用的管理界面
- ⚡ 高性能:基于 Jetty 服务器 + 线程池,支持高并发打印任务
- 🔄 格式转换:集成 JODConverter + LibreOffice 实现 Office 文档转换
核心技术:Java 8, Jetty 9.4, Maven
打印引擎:Apache PDFBox 2.0
格式转换:JODConverter 4.4 + LibreOffice
界面框架:Swing + FlatLaf
日志系统:SLF4J + Logback
企业级 AI 数据预处理平台
拥抱 AI 时代的实践项目,一个功能强大的企业级 AI 数据预处理平台,支持多模态数据处理。
-
📄 文档处理:支持 PDF、Word、Excel、PPT 转换为 Markdown/JSON
- 集成 MinerU Pipeline(完整解析)
- DeepSeek OCR(高精度识别)
- PaddleOCR-VL(109+ 语言支持)
- 智能水印检测与去除(YOLO11x + LaMa)
-
🎬 视频处理:支持 MP4、AVI、MKV、MOV 等格式
- 视频音频提取 + 语音识别
- 关键帧 OCR(场景检测、质量过滤、智能去重)
- 多语言、说话人识别、情感识别
-
🎙️ 音频处理:支持 MP3、WAV、M4A 等格式
- SenseVoice 引擎多语言识别
- 说话人识别和分离
- 情感识别(中性/开心/生气/悲伤)
-
🖼️ 图片处理:支持 JPG、PNG 等格式
- 多种 OCR 引擎可选
- GPU 加速处理
- 智能水印预处理
-
🏗️ 企业级特性:
- GPU 负载均衡(LitServe)
- 任务队列与优先级管理
- MCP 协议支持(可被 AI 助手直接调用)
- 现代化 Web 管理界面
前端:Vue 3 + TypeScript + TailwindCSS + Vite 后端:FastAPI + LitServe + SQLite AI 引擎:MinerU + DeepSeek OCR + PaddleOCR-VL + SenseVoice
- ✅ 完整的前后端分离架构
- ✅ GPU 负载均衡与多 GPU 隔离
- ✅ 支持 MCP 协议,可与 Claude Desktop 等 AI 助手无缝集成
- ✅ 实时任务监控与状态追踪
- ✅ 批量处理与自动重试机制
- ✅ 模块化设计,易于扩展
🔥 MinerU - PDF 文档解析工具
项目简介:由上海人工智能实验室 OpenDataLab 团队推出的开源智能数据提取工具,专注于复杂 PDF 文档的高效解析与提取。
我的贡献:
- API服务实现:主动拉取模式,优化任务调度机制,提升系统性能和可维护性 (08a89ae)
- 依赖完善:完善
markitdown依赖管理,确保 Markdown 处理功能稳定可靠 (cedc62a) - 代码优化:修复代码审查中提出的问题,提升代码质量和可读性 (e7d8bf0)
技术栈:Python, PyTorch, FastAPI, Worker Pool, 文档解析
⚡ LightRAG - 轻量级 RAG 框架
项目简介:由香港大学数据智能实验室(HKUDS)开发的轻量级检索增强生成(RAG)框架,提供简单高效的 RAG 解决方案。
我的贡献:
- 多轮对话支持:实现多轮对话功能,增强系统的交互能力 (8c121f5)
- 缓存系统修复:修复缓存处理的运行时错误,提升系统稳定性 (f6d29e1)
- 异常处理优化:修复异常导致的数据更新卡死问题,确保数据流程正常进行 (443aab2)
- 断点续传优化:修复断点续传 bug,过滤已存在且处理完成的文档,避免重复处理 (7271ac6)
- 知识图谱增强:增强知识图谱关系的时序性支持,提升图谱质量 (7b91dc7)
技术栈:Python, RAG, 知识图谱, 对话系统
- GitHub: @magicyuan876
- 项目主页: MinerU Tianshu
我热衷于分享技术经验和开源项目的开发心得。如果你对我的项目感兴趣,或者有任何技术问题,欢迎通过 GitHub Issues 与我交流!


