微信 AI 应用场景作品集

Overview

微信 AI 应用场景作品集

项材料：阅读、IM、评测、Agent 和 NLP 项目

份微信读书 AI 阅读助手 PRD 摘要

维回答质量标准，用于拆解 AI 功能效果

类复合模型评测任务，模型名称已脱敏

Selected Work

核心项目

Project 01 / 主作品

微信读书 AI 阅读助手

个人 PRD / 原型作品，完成于 2026.05。项目从微信读书网页端的阅读场景出发，处理“读到不懂处需要解释、想追问前后文、希望把摘录整理成笔记”的问题。方案以 Side Panel 作为主界面，承载摘录、分析结果、历史记录、设置和看板。

交互链路：文本捕获 -> 模板选择 -> 可选上下文注入 -> 模型调用 -> Side Panel 展示 / 保存 -> Markdown 导出。
核心功能：概念解释、跨章节追问、结构化笔记、Markdown 导出；上下文注入默认关闭，由用户主动选择。
效果标准：准确性、相关性、可追溯性、可读性、有用性、安全边界；badcase 重点看上下文断裂、过度延伸和来源不可验证。
产品边界：AI 用来降低理解和整理成本，不替读者给出最终判断；低置信答案需要提示，引用要能回到原文。
后续改进：上下文联动默认关闭能减少打扰，但首次使用时不够直观，需要补一个轻量的新手引导。

打开 PRD 摘要 PDF

Project 02 / 真实评测经历

AI 模型能力评测

兼职评测经历，2026.06 至今。基于 OpenClaw / Hermes 两类 Agent 执行架构，对 5 个代号模型运行 3 类复合任务，模型真实名称和平台信息不公开。

任务规模：按 5 个模型、3 类任务整理为 15 组任务记录，覆盖代码仓库审查、CSV 数据清洗与图表产出、营销方案风险识别。
观察重点：多步执行是否断链，工具调用是否稳定，文件是否按要求保存，最终结论是否和过程一致。
失败模式：工具调用失败、上下文丢失、多步约束断裂、产物不可验证。
迁移到产品：把“理解意图 -> 调用工具 -> 校验结果 -> 用户确认 -> 保存结果”作为工具调用类 AI 功能的可控链路。
反思：评测任务容易偏向“模型能不能做”，产品侧还需要补充真实用户场景，判断结果是否值得进入功能设计。

Project 03 / IM 协同场景

群聊总结到待办候选方案

个人方案作品，完成于 2026.06。以企业微信公开 AI 办公能力为参照，拆解群聊消息过载、结论分散、责任不清和后续跟进弱的问题。方案重点不是再做一个摘要，而是把摘要后的信息接到协作动作。

功能链路：未读 / 今日消息总结 -> 结论 / 待办 / 风险 / 待确认项提取 -> 用户确认、编辑或忽略 -> 转待办 -> 群提醒。
对比维度：IM 降噪、AI 办公入口、摘要能力、待办转化、来源追溯、权限合规、数据回流。
设计边界：AI 不自动派活；责任人、截止时间和风险提醒必须保留来源，权限继承群聊和企业通讯录规则。
后续改进：当前方案偏“事后总结”，还可以探索在讨论接近结论时给出轻提醒，但提醒频率必须克制。

Project 04 / 评测框架

Skill Lens AI 产品评测框架

2026.04 先做成个人 AI 产品审计清单；2026.06 参与模型评测后，把工具调用失败、产物不可验证、多步任务断链等问题补进框架。

当前维度：场景必要性、任务完成度、工具调用与状态管理、失败路径、成本安全与责任边界、迭代指标。
使用方式：用于检查一个 AI 功能是否真的解决任务、失败时是否可发现、结果能否被用户或系统验证。
边界说明：定位为个人作品集中的评测框架，范围是功能审查和 badcase 归因。

Project 05 / Agent 原型

nl2sql Agent 原型

腾讯云 CNB AI 应用训练营项目。基于 LangGraph / LangChain 搭建 nl2sql Agent 原型，用自然语言触发结构化查询，并把执行前后的风险控制放进流程。

实践内容：任务分解、Schema 识别、SQL 生成、工具调用、失败重试和结果返回。
风险控制：查询前校验表名和字段；高风险语句需要人工确认；失败后允许有限轮次重试。
和岗位相关：帮助理解 Agent 产品里“模型生成”和“系统执行”之间为什么需要校验层。

Experience Timeline

经历脉络

2026.06 - 至今兼职评测

AI 模型能力评测｜OpenClaw / Hermes 架构

围绕代码审查、数据清洗分析、营销风险识别等复合任务，记录模型在多步执行、工具调用、产物保存和结果一致性上的问题。

2026.04 - 2026.06产品框架

Skill Lens 评测框架

从 Prompt、Agent、Skill 和 AI 工作流出发，整理产品评测维度，用来检查 AI 能力是否适合进入真实任务。

2026.03 - 2026.04比赛

iFLYTEK AstronClaw 养虾挑战赛｜二等奖

围绕 Skill 的场景定义、交互链路和能力边界做设计表达，训练 AI 产品方案的结构化呈现。

2026.01 - 2026.02训练

北大光华 BA 训练营｜因果推断 / A-B 实验

学习实验设计、因果推断与指标分析方法，补足产品验证和数据评估能力。

2025.10 - 2025.12训练营

腾讯云 CNB AI 应用训练营｜nl2sql

基于 LangGraph / LangChain 搭建 nl2sql Agent 原型，实践任务分解、工具调用、失败重试和人工确认机制。

2025.05 - 2025.08项目

企业年报文本情感分析系统

处理企业年报文本数据，基于 BERT 训练分类模型，并打包 GUI 交付。

2023.08 - 2025.04职业方向调整

职业方向调整与 AI 产品准备

硕士毕业后曾获得校招 offer，原计划 2024.09 入职；后因职业方向重新评估，转向 AI 产品方向，并在 2025.05 起集中完成相关项目。

Role Fit

与微信 AI 场景的匹配点

微信生态场景

阅读、群聊和内容整理都属于微信生态中高频但容易被打断的任务，方案重点放在入口和确认链路上。

用户确认优先

AI 先整理候选信息，用户再确认是否保存、转待办、导出或继续追问，减少自动化越界。

效果标准可追问

项目材料中写了回答质量、采纳、编辑、误识别反馈和二次使用等指标，便于讨论如何验证。

理解模型边界

评测和 Agent 原型暴露了工具调用、状态保持、失败恢复和产物校验的问题，能反推产品侧的兜底设计。