系统概览
目标与范围
第一阶段聚焦 In-vivo 核心业务,在中国区率先上线“项目数据同步 → AI 报告生成”的闭环体验,实现标准项目的一键式交付,并为图表、分析与模版提供可配置能力,同时保持与 SD 的会话上下文一致。
第二阶段扩展至 In-vitro 与 Biomarker 业务,打造 Protocol Builder 以实现 In-vivo Protocol 自动化配置与交互;第三阶段贯穿 Protocol → Study Execution → 数据监控的全链路,部署面向关键环节的 AI 决策与提醒服务,逐步形成全球可复用的平台能力。
平台需支撑多数据源同步、面向 AI 的数据治理、灵活的模版管理与跨区域部署,为全球业务扩展提供基础。
关键角色
- Study Director(SD):配置项目参数、上传 protocol、驱动数据确认与报告审核。
- Bioinformatics & AI 团队:维护 AI 模型、HuPharm 参数模板、统计策略与提示词。
- IT & DevOps:保障部署、集成、性能监控与灾备运维。
- 产品运营团队:管理模板、术语库与全球化配置,为后续阶段业务扩展提供支持。
核心流程概览
核心流程围绕项目全生命周期展开,采用串联式业务主流程 + 并行数据与合规控制。下图展示四个阶段的主要节点与关键能力:
- Studylog 定期同步项目号、默认参数与基础数据。
- 系统正式上线前,protocol 通过人工上传;上线后自动解析章节与时态校准。
- 配置 HuPharm 调用参数,支持在统计分析前后灵活调整。
- 对标准、简单项目提供一键生成报告入口。
- 按项目展现表格化数据与图表(BW/TV、Prism 图形等),实时联动更新。
- 支持隐藏/恢复指定日期、组别或单鼠数据,并保留操作记录。
- 允许 FLUX/BLI 数据上传替换、组标签标准化,并导出 Prism 兼容数据。
- 接收 Survival 数据并调用 HuPharm 获取统计分析结果。
- AI 生成项目总结、结论与建议,保持单 Study 单会话上下文。
- 按 SD/客户偏好选择模版,在线编辑章节。
- 版本管理、差异追踪、Word 导出。
- 逐一按单模型流程与 SD 确认数据与分析。
- 整合所有模型结果至统一报告结构,支持双语切换。
- 签核完成后统一导出与归档。
功能规格
1. 项目初始化模块
- 项目选择与参数配置:从 Studylog 定期同步项目号、动物分组、默认参数(Reference Group、Randomization Day/Date、Analyse Day),用户可按需编辑并保存参数组合。
- Protocol 管理:在自动化解析上线前支持人工上传签署的 PDF/Word;上线后系统解析目录及章节内容,忽略样式但保留层级结构,并自动进行时态转换与术语标准化。
- HuPharm 参数:提供预设模型与阈值,可在统计分析前后进行调整;所有变更记录审批日志,保证追踪。
- 快速报告:对标准或简单项目提供一键生成报告流程,可在后续环节继续迭代内容。
2. 数据确认模块
- 数据可视化:展示 BW/TV 数据表与交互式图表(含 Prism 风格图形),支持多选筛选、数据点注释、异常标记,可导出 Prism 可用数据集。
- 数据校准:允许隐藏指定日期、组别或单只动物数据并记录操作痕迹;提供一键恢复与对比视图。
- 替换数据:上传标准化 FLUX/BLI Excel 模板,系统验证模板完整性后写入专用数据表,并优先替换对应 TV 数据。
- 标签管理:支持自动规范化(规则库)与手动改写,更新后同步至所有相关图表与报告标题。
- Survival 分析:收集死亡/终止记录,调用 HuPharm 计算 Kaplan-Meier、Log-rank;结果以图表和统计表展示。
- TGI/T:C 分析:基于确认的参数实时调用 HuPharm API,返回统计指标、置信区间及可视化输出。
3. AI 分析与报告模块
- AI 项目总结:根据 TGI、Survival、病理及历史数据生成专业总结,遵循 CrownBio 风格;缺失数据时自动调整结论结构,并保持单 Study 单会话的上下文连续性。
- 个性化分析:结合客户偏好、历史报告、实验所在地规则生成定制化措辞;支持双语生成与跨版本对比。
- 报告模版工作台:推荐默认模版,在线编辑章节标题、顺序与内容,提供版本管理、差异高亮、权限控制。
- 数据附录:原始数据表展示于报告末尾,并支持导出为 Excel 附件。
- Word 导出:使用标准化 DOCX 模版引擎生成可追溯文件,包含数字签章与水印。
4. 多模型报表模块
- 多模型管理:支持批量导入、过滤与状态监控;每个模型按单项目流程与 SD 协作确认数据与结论。
- 结果整合:合并各模型关键指标、图表与总结,生成总览与单模型子章节。
- 交付输出:统一导出 Word/PDF,附带审批记录与审计日志,支持双语切换。
5. 系统通用能力
- 双语切换:界面、分析内容与报告模版支持中英文切换,默认随项目 Region 设置。
- 审计与权限:基于角色的访问控制(RBAC),操作记录、数据版本与审批流程全量追踪。
- 通知提醒:集成邮件与站内消息,支持关键节点提醒、审批代办、分析完成推送。
- 配置中心:预置参数、模板、HuPharm 配置集中管理,支持灰度与回滚。
用户体验与交互
导航策略
- 顶级导航按业务阶段划分,侧栏呈现关键任务与状态。
- 数据确认页面采用多面板布局:左侧条件筛选,中部数据表,右侧图表即时更新。
- 报告编辑器内嵌模块化章节面板,支持拖拽排序与版本对比。
可用性要求
- 核心操作 ≤ 3 步完成;系统操作反馈 ≤ 1 秒。
- 图表交互需提供缩放、下载、注释功能,并支持 Prism 图形样式与数据导出。
- AI 生成内容支持“接受/编辑/拒绝”与差异标记。
国际化 & 无障碍
- 界面文案支持中英文实时切换,遵循 CrownBio 术语库。
- 遵循 WCAG 2.1 AA,颜色对比度 ≥ 4.5:1,所有控件支持键盘访问。
- 日期、数值格式随区域设定自动调整。
用户支持
- 内置引导流程,覆盖首次配置、AI 总结、模版导出。
- 提供上下文帮助中心,集成常见问题、视频示例。
- 支持在线反馈与问题工单系统。
AI 能力与数据策略
模型目录
Protocol NLP 引擎
识别 protocol 章节结构、提取关键参数并进行时态转换;采用中文/英文双语预训练模型 + 规则校正。
分析总结生成模型
结合 TGI、T:C、Survival、实验条件与历史报告生成专业总结;支持提示词配置与风格调优。
Study 分类模型
基于项目元数据与实验流程自动判断是否标准 Study,为多模型报表提供快速路径。
训练与部署要求
- 采用 CrownBio 内部标注数据集,确保客户与实验数据脱敏处理。
- 模型训练需通过 MLOps 流水线管理,提供版本控制、性能基准、回滚机制。
- 推理服务通过 API 暴露,支持负载均衡与熔断;关键指标包括延迟(P95 < 800ms)与可用性(99.5%)。
- 引入人机协同校验(Human-in-the-loop),关键分析结论需人工确认后才能出现在正式报告中。
数据治理
- 明确数据分类(公开、内部、机密、受限),按分类控制访问与加密策略。
- AI 训练集需记录数据血缘、来源系统、发布时间与审批记录。
- 对外部供应商 API(如 HuPharm)调用需记录输入参数与返回值快照,以便审计与追踪。
系统集成与数据流
| 外部系统 | 数据类型 | 同步模式 | 关键控制 |
|---|---|---|---|
| Salesforce | 项目、客户、联系人、BD 信息 | 每天增量 + 即时 webhook | 字段映射校验、重复项检测、变更审计 |
| ELN | 最终 Protocol、实验步骤、原始记录 | 受控拉取(审批触发) | 版本锁定、内容哈希校验、签署验证 |
| Studylog | 动物分组、BW/TV 数据、实验事件 | 准实时(15 分钟轮询) | 数据一致性校验、异常告警、回放机制 |
| Cell Data | 细胞系信息、批次、存储条件 | 每日同步 | 主数据管理(MDM)校验、生命周期追踪 |
| HuPharm API | %TGI、%T/C、统计显著性 | 实时调用 | 参数版本控制、重试策略、延迟监控 |
| Report 模版库 | 客户定制模版、标准模版 | 集中管理,按需推送 | 模版审批、权限隔离、变更通知 |
数据同步策略
通过企业级数据总线 (ESB) 或 API 网关实现标准化接入,采用统一的消息格式(JSON + Schema Registry),并通过 CDC/队列确保增量与顺序。
错误处理
所有集成接口需暴露重试策略、失败告警与人工介入流程;提供观测平台对吞吐、失败率、延迟进行监控。
非功能需求
性能
- 核心页面首屏加载 ≤ 3 秒,交互延迟 P95 ≤ 1 秒。
- 支持同时 500 名活跃用户,HuPharm 调用峰值 200 次/分钟。
- 报表导出任务支持并发队列,平均完成 ≤ 2 分钟。
可靠性
- 服务可用性 ≥ 99.5%,支持跨区域灾备与自动故障转移。
- 关键数据每日全量备份,保留 ≥ 7 年。
- AI 推理服务部署多活架构,具备熔断与降级逻辑。
可维护性
- 采用微服务 + 事件驱动架构,服务间接口通过 OpenAPI 定义。
- CI/CD 覆盖单元测试、集成测试、UI 自动化与安全扫描。
- 配置即代码(Configuration-as-Code),变更需双人审核。
可扩展性
- 模块化设计,支持新增分析类型、第三方算法接入。
- 报告模版引擎支持插入客户自定义组件与宏。
- 数据仓库预留扩展字段与多模数据模型。
监控与告警
- 建立统一观测平台,覆盖日志、指标、追踪三类数据。
- 对 AI 相关指标(质量评分、拒绝率)设置阈值告警。
- 用户操作异常、权限越权实时通知安全团队。
本地化
- 支持中国、美国、欧洲部署模式,可灵活选择数据落地位置。
- 时间与货币格式随地区配置;遵循当地法规 (如 GDPR, CSL)。
- AI 模型策略可区域化,满足不同法规要求。
合规、安全与审计
安全策略
- 采用零信任访问控制,启用 SSO + MFA,关键操作二次验证。
- 所有数据静态与传输加密(AES-256 & TLS 1.2+),密钥托管于企业 KMS。
- 分级权限:数据读取、编辑、导出、AI 调用需分别授权。
- 异常访问检测:引入 UEBA,对异常模式实时阻断。
合规框架
- 遵循 GLP/GCP 行业规范,记录完整的实验数据修订历史。
- 满足 GDPR、CCPA 对个人信息的控制要求,提供数据主体访问与删除功能。
- AI 结果透明化,提供提示词、输入数据范围、生成版本的审计记录。
- 审计日志不可篡改,保留至少 10 年,可导出至 SIEM 系统。
风险控制
- 建立变更管理委员会(CCB),重大配置与模型更新需审批。
- 定期执行渗透测试与 SOC2 Type II 审计,发现问题需在 SLA 内闭环。
- 提供业务连续性计划(BCP)与灾难恢复演练,确保 RTO ≤ 4 小时,RPO ≤ 30 分钟。
交付计划与运营
里程碑规划
完成项目数据同步、协议上传解析、HuPharm 参数配置、数据确认交互与 AI 驱动的报告生成,满足中国区 In-vivo 业务落地。
运营与支持
- 建立产品运营团队,负责模板维护、AI 提示词迭代、用户培训。
- DevOps 负责 24/7 监控、升级、SLA 管理;提供分级支持响应机制。
- 定期复盘 KPI(效率、质量、满意度)并驱动持续优化。