Overview

微信 AI 应用场景作品集

5
项材料:阅读、IM、评测、Agent 和 NLP 项目
1
份微信读书 AI 阅读助手 PRD 摘要
6
维回答质量标准,用于拆解 AI 功能效果
3
类复合模型评测任务,模型名称已脱敏
Selected Work

核心项目

Project 01 / 主作品

微信读书 AI 阅读助手

个人 PRD / 原型作品,完成于 2026.05。项目从微信读书网页端的阅读场景出发,处理“读到不懂处需要解释、想追问前后文、希望把摘录整理成笔记”的问题。方案以 Side Panel 作为主界面,承载摘录、分析结果、历史记录、设置和看板。

  • 交互链路:文本捕获 -> 模板选择 -> 可选上下文注入 -> 模型调用 -> Side Panel 展示 / 保存 -> Markdown 导出。
  • 核心功能:概念解释、跨章节追问、结构化笔记、Markdown 导出;上下文注入默认关闭,由用户主动选择。
  • 效果标准:准确性、相关性、可追溯性、可读性、有用性、安全边界;badcase 重点看上下文断裂、过度延伸和来源不可验证。
  • 产品边界:AI 用来降低理解和整理成本,不替读者给出最终判断;低置信答案需要提示,引用要能回到原文。
  • 后续改进:上下文联动默认关闭能减少打扰,但首次使用时不够直观,需要补一个轻量的新手引导。
打开 PRD 摘要 PDF
Project 02 / 真实评测经历

AI 模型能力评测

兼职评测经历,2026.06 至今。基于 OpenClaw / Hermes 两类 Agent 执行架构,对 5 个代号模型运行 3 类复合任务,模型真实名称和平台信息不公开。

  • 任务规模:按 5 个模型、3 类任务整理为 15 组任务记录,覆盖代码仓库审查、CSV 数据清洗与图表产出、营销方案风险识别。
  • 观察重点:多步执行是否断链,工具调用是否稳定,文件是否按要求保存,最终结论是否和过程一致。
  • 失败模式:工具调用失败、上下文丢失、多步约束断裂、产物不可验证。
  • 迁移到产品:把“理解意图 -> 调用工具 -> 校验结果 -> 用户确认 -> 保存结果”作为工具调用类 AI 功能的可控链路。
  • 反思:评测任务容易偏向“模型能不能做”,产品侧还需要补充真实用户场景,判断结果是否值得进入功能设计。
Project 03 / IM 协同场景

群聊总结到待办候选方案

个人方案作品,完成于 2026.06。以企业微信公开 AI 办公能力为参照,拆解群聊消息过载、结论分散、责任不清和后续跟进弱的问题。方案重点不是再做一个摘要,而是把摘要后的信息接到协作动作。

  • 功能链路:未读 / 今日消息总结 -> 结论 / 待办 / 风险 / 待确认项提取 -> 用户确认、编辑或忽略 -> 转待办 -> 群提醒。
  • 对比维度:IM 降噪、AI 办公入口、摘要能力、待办转化、来源追溯、权限合规、数据回流。
  • 设计边界:AI 不自动派活;责任人、截止时间和风险提醒必须保留来源,权限继承群聊和企业通讯录规则。
  • 后续改进:当前方案偏“事后总结”,还可以探索在讨论接近结论时给出轻提醒,但提醒频率必须克制。
Project 04 / 评测框架

Skill Lens AI 产品评测框架

2026.04 先做成个人 AI 产品审计清单;2026.06 参与模型评测后,把工具调用失败、产物不可验证、多步任务断链等问题补进框架。

  • 当前维度:场景必要性、任务完成度、工具调用与状态管理、失败路径、成本安全与责任边界、迭代指标。
  • 使用方式:用于检查一个 AI 功能是否真的解决任务、失败时是否可发现、结果能否被用户或系统验证。
  • 边界说明:定位为个人作品集中的评测框架,范围是功能审查和 badcase 归因。
Project 05 / Agent 原型

nl2sql Agent 原型

腾讯云 CNB AI 应用训练营项目。基于 LangGraph / LangChain 搭建 nl2sql Agent 原型,用自然语言触发结构化查询,并把执行前后的风险控制放进流程。

  • 实践内容:任务分解、Schema 识别、SQL 生成、工具调用、失败重试和结果返回。
  • 风险控制:查询前校验表名和字段;高风险语句需要人工确认;失败后允许有限轮次重试。
  • 和岗位相关:帮助理解 Agent 产品里“模型生成”和“系统执行”之间为什么需要校验层。
Experience Timeline

经历脉络

2026.06 - 至今兼职评测

AI 模型能力评测|OpenClaw / Hermes 架构

围绕代码审查、数据清洗分析、营销风险识别等复合任务,记录模型在多步执行、工具调用、产物保存和结果一致性上的问题。

2026.04 - 2026.06产品框架

Skill Lens 评测框架

从 Prompt、Agent、Skill 和 AI 工作流出发,整理产品评测维度,用来检查 AI 能力是否适合进入真实任务。

2026.03 - 2026.04比赛

iFLYTEK AstronClaw 养虾挑战赛|二等奖

围绕 Skill 的场景定义、交互链路和能力边界做设计表达,训练 AI 产品方案的结构化呈现。

2026.01 - 2026.02训练

北大光华 BA 训练营|因果推断 / A-B 实验

学习实验设计、因果推断与指标分析方法,补足产品验证和数据评估能力。

2025.10 - 2025.12训练营

腾讯云 CNB AI 应用训练营|nl2sql

基于 LangGraph / LangChain 搭建 nl2sql Agent 原型,实践任务分解、工具调用、失败重试和人工确认机制。

2025.05 - 2025.08项目

企业年报文本情感分析系统

处理企业年报文本数据,基于 BERT 训练分类模型,并打包 GUI 交付。

2023.08 - 2025.04职业方向调整

职业方向调整与 AI 产品准备

硕士毕业后曾获得校招 offer,原计划 2024.09 入职;后因职业方向重新评估,转向 AI 产品方向,并在 2025.05 起集中完成相关项目。

Role Fit

与微信 AI 场景的匹配点

微信生态场景

阅读、群聊和内容整理都属于微信生态中高频但容易被打断的任务,方案重点放在入口和确认链路上。

用户确认优先

AI 先整理候选信息,用户再确认是否保存、转待办、导出或继续追问,减少自动化越界。

效果标准可追问

项目材料中写了回答质量、采纳、编辑、误识别反馈和二次使用等指标,便于讨论如何验证。

理解模型边界

评测和 Agent 原型暴露了工具调用、状态保持、失败恢复和产物校验的问题,能反推产品侧的兜底设计。