가벼운 범용 에이전트로 만들기 위한 검증 상태
픽셀포는 어디든 활용할 수 있는 로컬 에이전트를 목표로 합니다. 다만 전체 품질 pass는 실제 final answer evidence가 충분할 때만 쓰고, 부족한 항목은 partial로 남깁니다.
현재 전체 제품 QA: partial
이번에 통과한 것
- Reviewer scoring 0-5 체계와 자동 fail 조건.
- Browser UI waiting 상태와 final answer 검증 분리.
- Evidence integrity negative-control 검증.
- Latest-run-only final gate.
- Long-run scenario matrix 생성 기준.
아직 pass로 쓰지 않는 것
- Node/local 600개 이상 실제 장시간 실행.
- Browser UI 80개 이상 final answer settled 증거.
- Live web 40개 이상 source link와 query polarity 증거.
- Installed runtime 50개 이상 최신 패치 기준 검증.
- Windows 로컬 AI 연결 검증.
제품 원칙
- 일반 질문은 가볍게 바로 답합니다.
- 최신 정보는 공개 출처를 확인합니다.
- 권한이 필요하면 같은 질문으로 이어서 진행해야 합니다.
- 파일/코드 질문은 실제 파일을 읽고 답해야 합니다.
- 민감 권한은 자동 승인하지 않습니다.
- 출처가 부족하면 원인을 만들지 않고 한계를 말합니다.