HZ
HUANG ZIHAO AI 应用开发 / 多模态工程 / 智能体系统
Portfolio / Resume / Selected Work

黄梓皓 把模型能力落成可交付系统,而不只是停留在 Demo。

广东技术师范大学人工智能专业本科在读,正在把程序设计竞赛能力、AI 应用工程能力和生成式内容落地能力收束成一条清晰路径。 这不是一份只堆关键词的主页,而是把实习里真正做过的系统、比赛里真正拿到的结果,以及作品背后的方法,放到同一张页面里讲清楚。

发票信息提取模块
95%+ 准确率 / 3 秒内处理
Odoo 智能 Agent
订单处理效率提升 60%
竞品分析与海报生成
LangGraph / Dify / Jenkins
CCPC 银奖 + 国赛二等奖
算法与应用双线验证

个人概览

我的重点不是“懂很多概念”,而是把模型、流程、系统和结果真正串起来。 在学校里,我用竞赛证明算法与实现能力;在实习里,我把 OCR、VLM、Agent、AIGC 工作流真正做进业务链路; 在项目里,我更关心方案能否落地、是否可维护、能不能被继续用。

2段 AI 实习,分别覆盖企业级智能化和营销场景 AIGC 产品。
95%+发票识别准确率,完成从图像到结构化 JSON 的流水线闭环。
3s发票单张处理控制在 3 秒内,可批量处理并做字段映射适配。
60%Odoo 智能 Agent 落地后,订单相关处理效率提升约 60%。
教育背景

2023.09 - 2027.06,广东技术师范大学,人工智能专业,全日制本科在读。

技术侧重点

多模态识别、LangGraph 智能体、RAG、Prompt 设计、语义检索、前后端链路打通。

项目习惯

从需求拆解开始,优先做能验证价值的版本,再根据效果优化模型、交互和系统性能。

补充能力

CET-6,熟悉 Figma、Axure、网页与脚本自动化开发,能快速把方案推进到可展示状态。

核心实习经历

这里不做空泛总结,直接写我在两段实习里具体做了什么、做到了什么,以及这些内容为什么有分量。

蓝色光标(数字)传媒集团 · AI 实习生2025.09 - 2025.12

这一段经历更偏向“把生成式 AI 真正做进产品和业务流程”。

  • 面向汽车行业竞品分析场景,调研可落地的 AIGC 解决方案,参与搭建基于 LangGraph 的智能竞品分析 Agent,负责 Prompt 调优、MCP 数据采集接入及部分代码开发,实现从外部信息抓取、内容分析到结果生成的自动化闭环。
  • 参与自建海报设计平台 Eazywa 的 AIGC 功能开发,结合 Nano Banana Pro 落地图像生成与海报编辑能力,推进“文生海报”和“生成内容二次编辑”等核心功能的 MVP 验证,提升 AI 创意内容在营销场景中的可用性和后编辑效率。
  • 围绕输出质量、编辑体验与流程可用性持续做实验和迭代,基于 Dify 按 brief 搭建批量化广告/营销文案生成工作流,并利用 Jenkins 完善团队协作开发中的 CI/CD 流程,支撑 AIGC 工具持续开发。
广州前沿信息系统有限公司 · AI 应用开发实习生2025.06 - 2025.09

这一段经历更偏向“把 AI 模块直接接进企业系统,做成能跑的业务能力”。

  • 开发基于 OCR + VLM 多模态大模型的发票信息提取模块,集成 PaddleOCR、Qwen-VL 等模型,构建端到端发票处理流水线,实现发票图像到结构化数据的自动化转换,识别准确率达 95%+。
  • 设计可配置字段映射机制,支持多种发票格式适配,完成发票信息智能分类与数据清洗,将非结构化图像转成标准 JSON;同时做推理性能优化,将单张处理时间控制在 3 秒内,并支持批量处理。
  • 在 Odoo 18.3 中开发智能 Agent 对话机器人,采用 LangGraph 多智能体框架和通义千问 3 大语言模型,实现“订单上传 → 智能用料查询 → 库存需求分析 → 数据可视化展示”的完整流程,处理效率提升约 60%,并支持并发访问和实时展示。

代表项目

我的项目偏向“把多个技术点串成完整方案”,强调输入、理解、决策、反馈和部署方式的连通性。

苍穹智鉴 · 农业智能决策与监管平台

以项目负责人身份主导设计多模态识别 + 联邦学习 + 知识图谱 + GIS 可视化的一体化平台,面向病虫害识别、区域协同与隐私安全问题,构建支持 Android 与 Web 双端部署的中台雏形。

CNN + LSTMFedAvgRBACGIS
发票信息提取模块

面向企业票据处理场景,设计 OCR + VLM 端到端流水线,完成字段映射、分类清洗、JSON 结构化输出与批量推理优化,将单张处理时长控制在 3 秒内。

PaddleOCRQwen-VLJSON Pipeline
Odoo 智能 Agent 对话机器人

在 ERP 场景中落地多智能体工作流,支撑订单处理全流程自动化;技术栈涵盖 Python、LangGraph、LangChain、PostgreSQL、Redis 与 ECharts。

Odoo 18.3LangGraphECharts
Eazywa AIGC 海报设计能力

围绕营销场景的生成式创作体验,参与 Nano Banana Pro 图像生成与海报编辑能力集成,面向“文生海报”和“生成后二次编辑”做产品化验证和提示词链路优化。

AIGCMVPPrompt Design

作品精选

看多了文字的堆砌?来看点具体的:这张图、对应的创作信息,以及它拿到的一等奖证书,放在一起更能说明问题。

重点竞赛成果

竞赛经历主要分成两类:算法与程序设计强度验证,以及 AI 应用与项目落地能力验证。

蓝桥杯智能体开发大学组二等奖证书

蓝桥杯全国总决赛二等奖

第十六届蓝桥杯全国软件和信息技术专业人才大赛全国总决赛,项目实战赛“智能体开发大学组”二等奖,体现从大模型能力到具体应用设计的综合能力。

AgentNational Final
数维杯国际数学建模一等奖证书

数维杯国际数学建模一等奖

2025 数维杯国际大学生数学建模竞赛一等奖。材料显示团队来自广东技术师范大学,对建模分析、协作交付和竞赛节奏控制能力形成了补充验证。

Mathematical ModelingInternational Contest

软件著作权

除竞赛与项目外,我也参与将系统沉淀为正式登记的软件成果,说明工作并非停留在概念验证层面。

MiniSciMoe数字体系统软著证书
MiniSciMoe 数字体系统 V1.0

软著登记号:2026SR0469450。登记日期为 2026 年 3 月 20 日,体现数字化系统设计与落地参与。

茶语智韵创新实验室管理平台软著证书
茶语智韵创新实验室管理平台 1.0

软著登记号:2026SR0491991。以实验室管理与平台化协作为方向,体现项目规范化沉淀能力。

苍穹智鉴农业智能决策与监管平台软著证书
苍穹智鉴农业智能决策与监管平台

与核心代表项目同名,聚焦多模态识别与联邦学习结合的农业监管平台,延伸出完整的软件成果形态。

技术栈与方法

习惯从业务目标反推技术方案,尽量用合适而不过度的工程手段快速形成可验证版本,再持续迭代。

PythonSQLLangGraphLangChainDifyCozeOCR / VLMPrompt EngineeringRAGBGEFAISS + HNSWLoRARedisPostgreSQLEChartsFigma / AxureJenkinsWeb / 小程序