上传CSV日志,本地计算可靠性指数,3分钟获得工程级评估报告。纯前端计算,数据永不离开您的设备,满足等保、GDPR隐私要求。
模型越来越多,场景越来越广,但"这个模型到底可不可靠"——大多数团队只能靠感觉判断。FSHI以S/R/M三维指标,为模型可靠性提供可量化的工程级评估依据。
数据永不离开您的设备。无需上传日志,满足等保二级、GDPR等隐私合规要求。浏览器本地完成全部计算。
从生存(稳定性)、关系(公平性)、意义(可解释性)三个维度量化模型可靠性,FSHI综合得分直观反映模型可靠程度。
识别逻辑死锁、token浪费、反复重试等深层异常,暴露传统指标无法发现的系统性问题。
无需注册账号,无需API Key,不限检测次数。仅需CSV包含 response 字段即可开始分析。
| 层级 | 状态 | 检测能力 | 技术方案 |
|---|---|---|---|
| L1 工程级 | 已开放 | 响应稳定性、错误率、安全合规性 | 规则引擎 · 本地计算 · 无需 API Key |
| L2 语义级 | 开发中 2026 Q3 | 幻觉识别、多轮追踪、逻辑一致性 | 调用大模型 API · 需自备 API Key |
| L3 认知级 | 规划中 2026 Q4 | 边界自知、概念固化、觉性场监测、审计日志防篡改存证 | 梦蝶引擎 · 私有化部署(可选接入私有链/联盟链) |
模型评测版:多模型并发辩论,FSHI加权投票,P3付费用户优先内测,Q3开放。
上传CSV日志,3分钟获得工程级评估报告,无需注册,完全免费。