결정론 데이터셋,
출처와 재현 해시까지.
데이터 표면 — 기관·연구팀을 위한 결정론 데이터셋. 모든 산출물에 출처와 재현 해시가 따라옵니다. 전례 시나리오 코퍼스, 적대적 압박 페어, 파이프라인 진단 픽스처를 모델 평가·검증 자산으로 받아가실 수 있습니다.
무엇을 받아가시나요
전례 시나리오 코퍼스
80셀 택소노미 위에서 결정론으로 생성된 사업 전례 시나리오. 좌표·증거 경계·바이어 미시구조가 셀마다 구조화되어 있습니다.
스펙 보기 ↓적대적 압박 페어
깨끗한 시나리오에 과장 주장을 주입해 차단·완화·복구까지 묶은 음성 대조 페어. ATS 리프와 록스텝으로 주문 시 생성됩니다.
스펙 보기 ↓진단 · 파이프라인 QA 픽스처
렌더 품질 회귀를 잡는 부정 픽스처. 잡혀야 할 잘못된 출력과 기대 게이트를 짝지어, 파이프라인이 무엇을 막아야 하는지 명시합니다.
스펙 보기 ↓전례 시나리오 코퍼스
사업 패턴을 좌표·증거 경계·바이어 미시구조로 구조화한 결정론 전례 코퍼스. 모델 평가·검색 그라운딩·합성 사전훈련을 위한 구조화 입력입니다.
정체
결정론 시나리오 아티팩트(artifact_kind: scenario_artifact). 같은 입력은 같은 산출과 같은 replay 해시를 냅니다. 엔진은 forward-only — 구조화 입력에서 셀 단위로 생성됩니다.
내용 · 구성
셀마다 구조적 좌표(섹터·사업모델·운영자 역할·지리), 증거 컨텍스트(fact_cards·source_cards·누락 증거), 바이어 미시구조, 창업자 DNA, 제약 프로파일, 사업 시나리오, 주장 후보가 함께 묶입니다.
규모 (정직)
~2,000,000아카이브된 실제 생성·검증 셀/시나리오 약 200만 건. 천장 수렴이 확인된 코퍼스이며, 창업 가능 leaf 463개 중 약 41%가 좌표로 덮여 있습니다(나머지는 준비 중).
핵심 스키마
출처 · 재현
결정론 · 같은 입력엔 같은 산출:
replay_hash sha256:3f09213f…0c0a992bd
artifact_hash sha256:3d886799…0de710d8
적대적 압박 페어
깨끗한 시나리오에 심각도 높은 과장을 주입해 차단·완화·복구까지 묶은 음성 대조 데이터. 안전 정렬·거절 평가에 필요한, 다른 곳에서 구하기 어려운 자산입니다.
정체
REDOUBT(구 RT) 페어 = MOSAIC 시나리오 + 주입된 과장 → 탐지 → STOP(리프, 심각도) → 안전 재작성 → 복구. ATS 리프와 록스텝으로 같은 산출을 냅니다.
내용 · 구성
각 리프는 탐지 패턴(ko/en), 주입 과장 문장, 안전 재작성, 복구(무엇이 잠금을 푸는가)를 가집니다. 심각도 우선(severe-first) 범위로, 가장 책임이 큰 리프부터 다룹니다 — 39개로 가산 확장됩니다.
규모 (정직)
컴파일러 준비됨 · 주문 시 생성고정된 대량 카운트가 아닙니다. 페어는 ATS 리프와 록스텝으로 주문 시 결정론적으로 컴파일됩니다. 현재 심각도 우선 리프 세트(약 10개, severe·moderate)가 활성이며, 가산 확장됩니다.
핵심 스키마
출처 · 재현
결정론 컴파일 · 시드·리프가 같으면 같은 페어:
replay_hash sha256 (페어마다)
lockstep ATS leaf ↔ REDOUBT pair
진단 · 파이프라인 QA 픽스처
렌더 품질 회귀를 잡는 부정 픽스처. 잡혀야 할 잘못된 출력과 기대 게이트를 짝지어, 렌더·검증 파이프라인의 회귀 스위트를 구성합니다.
정체
fixture_type: render_quality_regression. 각 항목은 malformed_surface(잡혀야 할 입력)와 기대 게이트(gate)·기대 응답(reject)을 담습니다. fixture_status=active 인 것은 출시 전 hard-fail 대상입니다.
내용 · 구성
조사 누락 폴백, 라벨·본문 중복, 내부 가드 메시지 누출, 한·영 언어 잔존, 잘못된 JSON·CSS, 누락된 재현 해시, 금지 주장 단언, 위치 데이터의 수요 과장까지 — 실제로 잡았던 회귀를 픽스처로 보존합니다.
규모 (정직)
13 활성 픽스처 (샘플)렌더 회귀 픽스처 13건(전부 fixture_status=active)으로 구성된 QA 샘플입니다. 대량 데이터셋이 아니라 회귀 스위트 — 파이프라인이 무엇을 막아야 하는지의 명세이며, 가산 확장됩니다.
핵심 스키마
접근 · 라이선스
기관 문의 · inquiry →현재 QA 픽스처 샘플 단계입니다. 전체 회귀 스위트·통합 조건은 도입 목적에 맞춰 협의하며, 일부 항목은 준비 중 / 문의입니다.
출처 · 재현
결정론 회귀 · 각 픽스처는 게이트로 재현 검증:
regression_test_ref dirty-atlas-render-regression.mjs
gate scanRenderQuality()