高先生

高先生

AI 基础设施工程师 / 全栈架构师

联系方式

技术栈

  • Go 高性能编程精通
  • React/Next.js精通
  • AI Agent/RAG 架构精通
  • PostgreSQL 调优熟练
  • Rust (Tokio/Async)熟练
  • 分布式系统/CRDT熟练

个人特质

全栈架构视野
极致性能追求
技术攻坚能力
业务闭环落地

职业概述

专注于构建高性能 AI 应用基础设施的全栈架构师。以 Go 和 React 为核心技术栈,辅以 Rust 解决极端并发场景。在 AI Agent 编排、多模型高并发网关设计及实时协作系统(CRDT)方面拥有生产级落地经验。擅长通过底层工程优化(数据库调优/零拷贝)解决 AI 应用中的成本与延迟痛点,具备从复杂交互前端到高性能后端的全链路闭环能力。

专业技能

核心后端

精通 Go 语言高性能后端开发,具备 Rust (Tokio) 辅助构建高并发网关的能力。擅长设计基于 Actor 模型的消息系统,以及利用 CRDT 算法解决分布式实时协作难题。

AI 基础设施

精通 LLM 应用架构设计。包括:多模型统一路由与熔断、RAG 检索增强优化(Scatter-Gather 模式)、以及“LLM + 规则引擎”混合校验系统的构建。

数据与存储

擅长数据库深度调优。包括 PostgreSQL 内核参数优化、TinyLFU 智能缓存算法实现、海量数据写入优化(COPY 协议/分区表),以及向量数据库应用。

前端工程

精通 React/Next.js 生态与复杂 Web 应用架构。擅长实现 Headless BI 设计、流式渲染(Stream Hydration)、Canvas 可视化交互及 WebWorker 多线程处理。

架构与运维

熟悉云原生体系。掌握 Docker/K8s,精通基于 Casbin 的 RBAC/ABAC 混合鉴权体系设计,具备防御性编程与服务降级治理经验。

工作经历

山东斯伯特生物科技有限公司

2025 年 4 月 - 至今

技术负责人 / AI Infra|广州

直接汇报给创新业务线总监,全权负责企业 AI 基础设施与供应链数字化转型的架构落地。构建的 AI 协同生态直接赋能全公司数千名员工,深度覆盖内容创作(视频/多媒体)、产研研发及营销销售等核心业务线。主导了从供应链溯源、企业知识中台到多模态创意工具的建设,解决了高并发资源调度、大规模实时协作及数据合规等关键工程难题。

高性能计算与存储架构

  • 1基于 Go (业务逻辑) 与 Rust (核心网关) 混合架构,实现 FlowMuse 万级并发长连接管理,内存占用降低 80%,彻底消除 API 配额泄露风险
  • 2主导全量手机号段(十亿级)的解析引擎建设,利用 PostgreSQL COPY 协议结合内核调优,实现海量字典数据的快速构建与查询
  • 3设计“TinyLFU”智能缓存与零拷贝(Zero-Copy)传输机制,解决移动端弱网加载与后端缓存污染问题,首屏性能提升 50%

AI 工程化与 Agent 体系

  • 1搭建企业级 Agent 编排平台,设计基于 DSL 的状态机 Prompt 协议,支持 50+ 异构工具的启发式路由与热插拔
  • 2研发“LLM+规则引擎”混合校验系统,结合 AI 通用理解与代码确定性逻辑,解决供应链场景下的工业级合规审计风险
  • 3构建 ChatBI 自愈执行管道,实现 Text-to-SQL 的“生成-执行-报错-重写”闭环,SQL 执行通过率提升至 95%+

平台治理与稳定性建设

  • 1构建基于 Casbin 的企业级统一鉴权网关(Hybrid RBAC/ABAC),实现对飞书复杂组织架构的毫秒级动态权限判定与 Zero-Alloc 决策
  • 2解决多人实时协作难题,基于 Actor 模型实现故障隔离,集成 CRDT 算法彻底解决复杂图数据的状态冲突
  • 3设计防御性 Webhook 竞速熔断架构,通过“同步/异步赛跑”机制与多级流量整形,将外部接口可用性锁定在 100%

广州色改改智能科技有限公司

2024 年 1 月 - 2025 年 3 月

全栈工程师|广州

独立负责 AI 改色 SaaS 平台的全栈研发。基于 Go+Fiber 与 ComfyUI 构建了高可用的文生图/图生图处理管线,支撑 B/C 端业务快速增长。

AI 工程化与架构

  • 1设计分布式任务调度系统,利用 Kafka 解决计算密集型任务的队头阻塞问题,吞吐量提升 3 倍
  • 2构建基于 ComfyUI 的可编排图像生成管线,结合 ControlNet 实现对车辆材质光泽度的精准控制
  • 3实现基于 RAG 的智能客服系统与多租户资源管理架构,显著降低运营成本并提升用户留存率

全栈开发与数据驱动

  • 1基于 React+Next.js 构建高性能 SaaS 前端,建立完整的数据追踪分析体系,极大提升了用户转化率
  • 2负责技术选型与 DevOps 流程建设,基于 Docker+GitHub Actions 实现自动化部署,确保高质量交付

金蝶医疗软件科技有限公司

2022 年 8 月 - 2023 年 12 月

后端开发工程师|平台部|广州

负责数据中台核心服务开发,专注于数据质量控制与高性能比对算法优化。

性能优化与底层重构

  • 1引入 Rust 重写核心数据比对算法,利用其零成本抽象特性,将千万级数据比对场景下的接口响应速度提升 52%
  • 2设计字段级动态规则引擎与数据脱敏方案,在保障医疗数据合规性的前提下提升了处理效率

数据治理与可靠性

  • 1主导 7 个数据应用层服务的设计与实现,基于微服务架构扩展功能点 200 余项
  • 2排查并修复 30 余项历史遗留并发问题,显著提高了系统在高负载下的可靠性

项目经验

FlowMuse 多模态创意工作台 (Rust/Go)

2025.12 - 至今架构负责人

项目背景

一个集成式 AI 创意生产环境。针对多模型 API 的高并发 IO 等待痛点,在 Go 业务层之外引入 Rust 构建核心连接网关。

技术架构

Rust (Gateway)Go (Biz Logic)TokioCRDT
  • 采用多语言混合架构:Rust 处理高密度 IO 长连接与 Token 计量,Go 处理复杂业务逻辑
  • 基于 Actor 模型实现无锁编程,集成 CRDT 算法保障分布式状态一致性

核心功能与实现

1高性能网关与 FinOps 治理
问题

业务涉及海量长连接等待,且多模型调用缺乏统一的成本审计与熔断机制

方案

使用 Rust/Tokio 重构网关,利用 Future 零成本抽象挂起任务;集成 Token 级实时计量与预算熔断

成效

单机并发提升 5 倍,内存占用降低 80%,并实现精确到部门的 AI 成本归因

2多人实时协作引擎 (CRDT)
问题

多人在 100ms 延迟下操作复杂图数据(Graph),极易产生“幽灵连线”与状态冲突

方案

集成 Yrs (Rust Port of Yjs) 实现 CRDT 二进制状态合并,配合环形缓冲 (Ring Buffer) 做批量写优化

成效

彻底解决协作冲突,将高频操作下的数据库 IOPS 降低 99%,系统具备极强的 Panic 隔离能力

3Scatter-Gather 并行执行架构
问题

复杂的 Agent 任务(如从数据库中查品牌词)串行执行导致首字延迟(TTFB)过高

方案

利用异步模型实现 Scatter-Gather 模式,并行分发无依赖的 IO/计算任务

成效

复杂任务的 TTFB 降低约 40%,显著提升了用户侧的流式响应体验

企业级 AI 运营门户 (AI PaaS)

2025.04 - 至今全栈架构师

项目背景

基于飞书生态的 AI 中台基座。向下构建统一身份鉴权网关,中间层实现支持启发式路由的 Agent 编排内核,向上支撑 ChatBI、智能问答等多业务线。

技术架构

GolangReactCasbin (Extended)LLM OrchestrationHybrid SearchAST Parsing
  • 通过向 Casbin 注入自定义匹配算子实现飞书组织架构映射,实现毫秒级混合鉴权
  • 前端实现流式结构化渲染 (Streaming Structured Rendering),解决 AI 混合响应的即时组件化问题

核心功能与实现

1跨域 Agent 编排与状态机
问题

用户的综合性需求(如“新药上市合规审查”)往往跨越法律、医疗、舆情等多个隔离领域,单一 Prompt 无法协调异构工具链进行深度推理

方案

设计结构化 DSL 定义有限状态机 (FSM),将复杂任务拆解为“规划-调用-反思”的序贯流程,管理跨工具上下文流转

成效

将发散的自然语言转化为可控的确定性执行流,实现了复杂跨域任务的自动化闭环

2全域工具治理与启发式路由
问题

系统接入了 50+ 个异构工具(含多个垂直领域知识库),全量检索噪音巨大且上下文开销极高

方案

构建启发式路由网关,作为前置决策层精准分发 Query;配合“关键词+向量+重排序”的混合检索策略提升工具调用准确度

成效

显著降低了 Agent 的上下文负载,支持新工具/知识库的“分钟级”热插拔注册

3安全底座:混合架构统一鉴权 (Hybrid Auth)
问题

需同时处理标准 RBAC 与“入职满3年”等动态属性权限,且处于高频关键路径

方案

扩展 Casbin 运行时,注入飞书属性匹配算子构建 Hybrid RBAC/ABAC;利用 Zero-Alloc 优化热点路径

成效

实现飞书组织架构变更的秒级权限同步,单机万级 QPS 下 Zero GC 抖动

4ChatBI 自愈执行管道
问题

Text-to-SQL 生成存在概率性语法错误,且直接执行存在 DML/DDL 安全风险

方案

构建“生成-执行-报错-重写”的递归自愈闭环;基于 AST 解析实施物理级只读阻断

成效

SQL 最终执行成功率达 95%+,在保障数据绝对安全的前提下实现了自助分析

5流式解析与多态可视化
问题

LLM 响应混合了思维链与文本,且生成的 SQL 数据结构(长表)与前端图表库(宽表)存在阻抗失配

方案

构建无依赖流状态机实现即时渲染;设计“长宽表变形管道”与多态图表工厂,结合 OKLCH 算法实现自适应可视化

成效

实现了“边思考、边执行”的白盒化体验,以及与 UI 库解耦的 Headless BI 渲染架构

供应链质量溯源合规平台

2025.07 - 2025.10技术负责人

项目背景

面向制造业的端到端数字化方案。针对传统工厂数字化推行难的痛点,创新性地采用“无头架构”打通数据孤岛,并利用"LLM+规则引擎”技术解决非结构化质检报告的自动化采集与合规审计。

技术架构

GoReactLLM + Rule EngineTinyLFU CacheZero-Copy
  • 设计“文件即数据库”的无头架构,利用飞书云文档 API 实现数据的无感采集
  • 构建混合校验管道:LLM 负责非结构化提取,Go 代码负责确定性逻辑判定

核心功能与实现

1无感数字化与无头架构 (Headless & Zero-Friction)
问题

传统制造业一线员工抗拒复杂的 ERP 表单录入,导致数字化“最后一公里”数据断层

方案

放弃传统后台,设计“文件即数据库”的无头架构,直接复用飞书云文档作为数据入口,适配员工原有操作习惯

成效

实现业务侧“零培训”上线,将数据采集的人工摩擦降至零,确保了数据源头的真实性与完整性

2LLM + 规则引擎混合校验
问题

工业质检对合规判定容错率为零,纯 LLM 方案存在幻觉风险且难以过审

方案

构建分层防御体系:Schema 强制约束输出格式,IBAC 实施逻辑交集鉴权,代码层负责硬核数值比对

成效

实现了“可审计的智能”,在保留 LLM 通用理解力的同时锁死了安全合规下限

3TinyLFU 智能缓存与性能优化
问题

移动端弱网下查看数万份报告长列表卡顿,传统 LRU 缓存易受扫描污染

方案

引入 TinyLFU 算法提升缓存命中率;后端实现 AES 解密零拷贝,前端全链路二进制传输

成效

弱网首屏加载提速 50%,长列表滚动保持 60FPS,后端数据库压力大幅降低

全域电商数据采集与身份解析系统

2025.04 - 2025.05核心开发者

项目背景

构建面向全渠道(天猫/抖店)的电商数据资产化基础设施。作为数据中台的上游核心链路,该系统负责屏蔽外部异构平台的数据差异与网络复杂性,通过高吞吐采集、自动化清洗及全域身份对齐,将碎片化的外部流量转化为标准化的企业私域资产。

技术架构

GoPostgreSQL (Deep Tuning)RedisDefensive Engineering
  • 构建高可用数据接入网关,集成身份解析引擎与防御性 Webhook 架构
  • 基于 Go 反射与防御性编程治理异构数据源,确保数据契约的强一致性

核心功能与实现

1全量号码段解析引擎
问题

外部平台返回的数据为加密 MD5,无法直接用于营销触达;需预构建覆盖全中国手机号段(10亿+)的映射字典

方案

采用“临时表 + COPY 协议”策略缓冲海量字典数据,配合 bytea 二进制压缩存储,实现从加密数据到明文资产的毫秒级还原

成效

构建了低成本、高吞吐的解析基础设施,支撑了千万级电商会员数据的清洗与入库

2Webhook 竞速熔断机制
问题

外部平台强 SLA (5s) 约束,DB 抖动易引发重试风暴击穿系统

方案

设计混合竞速模式 (Sync/Async Race),主动熔断超时请求;实施多级流量整形与背压控制

成效

将数据接入接口的外部可用性锁定在 100%,从架构层面根除了级联雪崩风险

3动态鉴权状态机与瞬时穿透
问题

内网采集服务需接收公网 Webhook 鉴权回调,长期开放端口存在巨大的安全合规风险

方案

设计“拦截-穿透-销毁”状态机:在检测到 401 时挂起并发请求 -> 瞬间建立临时隧道 -> 获取 Token -> 立即销毁隧道并恢复请求

成效

通过这种“快进快出”的毫秒级窗口策略,在满足公网交互的同时将安全攻击面压缩至近乎为零

AI 智能改色 SaaS 平台

2024.01 - 2025.03项目负责人

项目背景

构建智能化的汽车改色可视化平台。解决传统改装行业效果不可预知、信息壁垒高的痛点,通过 AI 生成技术赋能 B 端门店销售转化与 C 端用户体验。

技术架构

Go (Fiber)React (Next.js)ComfyUIKafkaPostgreSQLRedis
  • 基于 Go 构建高并发控制层,集成 ComfyUI 实现可编排的图像生成工作流
  • 设计分布式任务队列与多租户架构,支撑 B/C 端业务的高可用运行

核心功能与实现

1分布式任务调度系统
问题

AI 生成任务计算密集且耗时长,单机处理易导致队头阻塞与资源利用率低

方案

设计基于 Kafka 的动态调度机制,实现任务智能分发与负载均衡;引入异常重试策略

成效

系统吞吐量提升 3 倍,平均等待时间减少 60%,任务处理成功率达 99.5%

2自适应 AI 改色引擎
问题

传统 GAN 方案生成的车辆光泽度失真,难以满足商业级预览需求

方案

设计基于 Stable Diffusion + ControlNet 的精准控制流,优化材质渲染算法

成效

支持 60+ 种颜色与 95% 常见车型,在数秒内生成接近真实喷漆质感的高清预览图

3RAG 智能客服与知识库
问题

传统 FAQ 无法满足用户个性化的改装咨询需求,人工客服成本高

方案

构建基于向量数据库的 RAG 知识库,结合 LLM 提供 24/7 智能问答服务

成效

极大提高了客户自助解决率,显著降低了人工客服工作负载

数据中台质量控制服务

2022.08 - 2023.12核心开发者

项目背景

为数据开发团队提供全链路数据质量治理能力。确保大规模数据流转过程中的准确性、完整性与一致性,保障医疗数据的合规安全。

技术架构

RustSpring BootMySQLRedisTrie Tree
  • 采用 Rust 重构核心计算模块,Spring Boot 处理业务编排,MySQL 存储元数据
  • 基于前缀树 (Trie) 算法实现高性能数据脱敏

核心功能与实现

1核心比对算法重构 (Rust)
问题

原 Java 实现的大规模数据比对存在性能瓶颈,严重影响数据开发效率

方案

引入 Rust 重写核心算法,优化内存布局与数据结构,将时间复杂度降至 O(n)

成效

接口响应速度提升 52%,CPU 和内存占用显著减少,支撑千万级数据快速比对

2高性能数据脱敏服务
问题

在开发测试环境中需实时脱敏敏感数据,传统正则替换效率低下

方案

设计基于类前缀树 (Trie) 的高效脱敏算法,支持多级策略动态配置

成效

在保障数据可用性与合规性的同时,处理效率提升 65%

3动态规则引擎
问题

数据质量校验规则多变,硬编码方式难以维护

方案

设计基于表达式的动态规则引擎,支持复杂条件组合与自定义函数

成效

覆盖 90% 以上常见数据质量问题,实现了校验规则的灵活配置

绩效管理数据集成平台

2023.05 - 2023.11核心开发者

项目背景

构建统一的人力资源数据仓库(HR Data Warehouse)。打破 CRM、禅道、钉钉等业务系统的数据孤岛,通过标准化的数仓建模为组织决策提供可量化的数据支持。

技术架构

Data WarehouseDimensional ModelingApache FlinkKafkaETL
  • 遵循数仓分层理论(ODS/DWD/DM),采用星型模式(Star Schema)进行维度建模
  • 基于 Flink + Kafka 构建实时 ETL 流水线,实现指标的动态计算

核心功能与实现

1数仓维度建模与星型架构
问题

各业务系统数据口径不一,难以进行跨维度的统一量化与下钻分析

方案

设计事实表(Fact)与维度表(Dim)的星型模式,建立了 15 个核心维度与 8 个关键业务过程事实表

成效

构建了标准化的数据模型,支持多维度的绩效透视分析,将用户报表产出时间缩短 65%

2分层治理与数据质量体系 (DWD)
问题

源端数据存在大量脏数据与格式差异,直接计算会导致绩效评估失真

方案

构建 ODS 到 DWD 的清洗层,设计数据质量监控指标(DQC)与异常阻断机制

成效

数据准确性提升至 99.5%,实现了异常数据的自动识别与告警,保障了数仓的可信度

3多源异构数据集成 (ETL)
问题

需整合 CRM、研发系统、OA 等 5+ 个异构数据源,结构差异巨大

方案

设计统一的异构数据抽取层 (EDL),通过元数据驱动(Metadata-Driven)实现自动映射与转换

成效

实现了全域绩效数据的自动化采集与更新,减少 90% 的人工数据整理工作

开源贡献

Clash 代理工具 (Linux)

系统级编程

  • 利用 Netlink 协议与 Syscall 实现跨平台进程生命周期管理
  • 解决了父子进程异常退出时的资源僵死问题,提升了守护进程稳定性

WeChat-ChatGPT2022.12 - 2023.01

独立开发者

项目成果

  • 获得 GitHub 社区 400+ Star 和 130+ Fork 的认可

工程实践

  • 基于 single-flight 模式解决高并发下的消息重传与资源浪费问题
  • 早期探索 LLM API 与 IM 平台的逆向工程集成,积累了 Prompt Engineering 经验

竞赛获奖

基于模拟退火算法的策略优化研究

2019 年 7 月
全国大学生数学建模竞赛本科组二等奖查看论文
  • 针对复杂运动系统设计数学模型,基于刚体转动理论与非线性规划构建求解方案
  • 独立实现模拟退火算法 (Simulated Annealing) 对系统进行全局优化,积累了扎实的算法落地与数据分析能力

CatcherOCR 交互式识别小程序

2020 年 3 月 - 5 月
微信小程序应用开发赛华南赛区三等奖
  • 独立开发基于 Canvas 的动态选区功能,实现移动端用户对图片文字区域的精准手势操作与交互
  • 早期探索 AI 落地应用,集成 OCR 文字识别、NLP 实时翻译及 TTS 语音合成接口,构建了完整的多模态交互体验

教育背景

广东医科大学

2019 - 2023
信息管理与信息系统本科东莞
  • 校优秀毕业生论文(基于知识库与 LLM 的智能健康诊断系统)
  • 全国大学生数学建模竞赛本科组二等奖 (2019)