🎓 Biography & Education
刘文豪于2021年9月进入上海大学,主修通信与信息工程。目前正在上海大学攻读硕士学位,专注于深度学习和人工智能领域的研究。
他专注于 AI 基础设施 和 大模型服务化工程 领域。致力于利用 Java 生态的高并发和高可用特性,解决大型模型部署中的核心工程挑战 — 特别是应对企业级的推理成本过高、响应延迟高以及数据链路复杂等痛点。
当前技术专研方向
他的学习路径围绕“AI 工程实现”分阶段推进:
- 底层基础: 利用 Java 虚拟线程构建高并发基座;使用 Spring AI 实现标准化的大模型接口调用;同时深入研究 Redis 向量模块 与关系型数据库的协同解决方案。
- 核心工程: 专注于 Java 原生推理工程,包括 ONNX Runtime 模型部署、DJL 深度学习库应用,以及 Llama.cpp 量化推理;同时构建涉及 Milvus/Pgvector 向量检索、非结构化数据 ETL 和 Embedding 工作流的 RAG 数据管道。
- 架构设计: 构建高性能 AI 网关(Netty/gRPC 通信,SSE 流式输出)以实现语义缓存、基于 Token 的限流和动态模型路由;探索 云原生 MLOps 实践,包括 K8s GPU 调度、容器镜像优化和 AI 全链路观测。
职业目标与发展方向
他致力于成为一名 AI 工程师,希望在 AI 基础设施领域发挥作用,特别是在 大模型服务化 和 推理性能优化 方面。他的目标是通过工程实践推动 AI 技术在企业中的实际应用,解决实际业务问题。
他期望加入中大型企业的 AI 平台团队、或 AI 转型部门,用工程能力让 AI 真正产生业务价值。他正在积极寻找一份日常实习机会,以积累实际项目经验并提升自己的技术能力。
目前已经掌握的技术栈
- 熟悉 Java、Python 编程语言;
- 熟悉 Pytorch 深度学习框架;
- 对计算机系统、网络有基本了解,能根据文档完成相关功能;
- 具备使用关系型数据库(如 MySQL、PostgreSQL 等)的经验;
- 熟悉 Docker 的基本原理及容器化技术;
- 能使用 Git/GitHub 等版本控制和 CI 工具;
- 具备基本的 Linux 命令行操作能力;
- 具备良好的英语阅读能力;
- 能够通过 Google/ChatGPT 等工具寻找解决方案;
Education
- Apr 2025 - Present Master's degree, Shanghai University (School of Communication and Information Engineering)
- Sep 2021 - Jun 2025 Bachelor's degree, Shanghai University