데이터 표면 · Data surface · 기관 · 연구팀

결정론 데이터셋,
출처와 재현 해시까지.

데이터 표면 — 기관·연구팀을 위한 결정론 데이터셋. 모든 산출물에 출처와 재현 해시가 따라옵니다. 전례 시나리오 코퍼스, 적대적 압박 페어, 파이프라인 진단 픽스처를 모델 평가·검증 자산으로 받아가실 수 있습니다.

결정론 · 재현가능 · 출처추적  ·  schema bies.scenario_artifact.v1 · replay sha256
카탈로그 · 3개 데이터 제품

무엇을 받아가시나요

MOSAIC

전례 시나리오 코퍼스

가장 성숙

80셀 택소노미 위에서 결정론으로 생성된 사업 전례 시나리오. 좌표·증거 경계·바이어 미시구조가 셀마다 구조화되어 있습니다.

스펙 보기
REDOUBT

적대적 압박 페어

컴파일러 준비됨

깨끗한 시나리오에 과장 주장을 주입해 차단·완화·복구까지 묶은 음성 대조 페어. ATS 리프와 록스텝으로 주문 시 생성됩니다.

스펙 보기
DIRTY ATLAS

진단 · 파이프라인 QA 픽스처

QA 픽스처 샘플

렌더 품질 회귀를 잡는 부정 픽스처. 잡혀야 할 잘못된 출력과 기대 게이트를 짝지어, 파이프라인이 무엇을 막아야 하는지 명시합니다.

스펙 보기
MOSAIC · 전례 시나리오 코퍼스

전례 시나리오 코퍼스

사업 패턴을 좌표·증거 경계·바이어 미시구조로 구조화한 결정론 전례 코퍼스. 모델 평가·검색 그라운딩·합성 사전훈련을 위한 구조화 입력입니다.

정체

결정론 시나리오 아티팩트(artifact_kind: scenario_artifact). 같은 입력은 같은 산출과 같은 replay 해시를 냅니다. 엔진은 forward-only — 구조화 입력에서 셀 단위로 생성됩니다.

내용 · 구성

셀마다 구조적 좌표(섹터·사업모델·운영자 역할·지리), 증거 컨텍스트(fact_cards·source_cards·누락 증거), 바이어 미시구조, 창업자 DNA, 제약 프로파일, 사업 시나리오, 주장 후보가 함께 묶입니다.

규모 (정직)

~2,000,000

아카이브된 실제 생성·검증 셀/시나리오 약 200만 건. 천장 수렴이 확인된 코퍼스이며, 창업 가능 leaf 463개 중 약 41%가 좌표로 덮여 있습니다(나머지는 준비 중).

핵심 스키마

artifact_id
아티팩트 식별자 (MS-SC-…)
structural_coordinates
섹터·사업모델·운영자·지리 좌표
claim_boundary
허용·금지 주장, 시장증명 상태
evidence_context
fact_cards · source_cards · 누락 증거
buyer_microstructure
페르소나·구매 트리거·전환 마찰
replay_hash
결정론 재현 해시 (sha256)
샘플 — 실제 아티팩트에서 발췌·축약

접근 · 라이선스

기관 문의 · inquiry

가격·범위는 도입 목적에 따라 협의합니다. 평가 샘플·라이선스 조건은 운영자 문의로 안내드립니다.

출처 · 재현

결정론 · 같은 입력엔 같은 산출:
replay_hash sha256:3f09213f…0c0a992bd
artifact_hash sha256:3d886799…0de710d8

해시-시일 모티프. 모든 실제 아티팩트는 자신의 replay_hash로 만든 고유 인장을 함께 지닙니다.
카탈로그로
REDOUBT · 적대적 압박 페어

적대적 압박 페어

깨끗한 시나리오에 심각도 높은 과장을 주입해 차단·완화·복구까지 묶은 음성 대조 데이터. 안전 정렬·거절 평가에 필요한, 다른 곳에서 구하기 어려운 자산입니다.

정체

REDOUBT(구 RT) 페어 = MOSAIC 시나리오 + 주입된 과장 → 탐지 → STOP(리프, 심각도) → 안전 재작성 → 복구. ATS 리프와 록스텝으로 같은 산출을 냅니다.

내용 · 구성

각 리프는 탐지 패턴(ko/en), 주입 과장 문장, 안전 재작성, 복구(무엇이 잠금을 푸는가)를 가집니다. 심각도 우선(severe-first) 범위로, 가장 책임이 큰 리프부터 다룹니다 — 39개로 가산 확장됩니다.

규모 (정직)

컴파일러 준비됨 · 주문 시 생성

고정된 대량 카운트가 아닙니다. 페어는 ATS 리프와 록스텝으로 주문 시 결정론적으로 컴파일됩니다. 현재 심각도 우선 리프 세트(약 10개, severe·moderate)가 활성이며, 가산 확장됩니다.

핵심 스키마

leaf
리프 슬러그 (예: health_outcome)
family
리프 계열 (outcome·roi·authority…)
severity
severe · moderate
overclaim {ko,en}
주입된 과장 문장
safe_rewrite {ko,en}
안전하게 완화한 재작성
recovery {ko,en}
무엇이 주장을 잠금 해제하는가
샘플 — 실제 리프에서 발췌·축약

접근 · 라이선스

기관 문의 · inquiry

페어는 주문 시 컴파일되므로 범위·리프 세트를 도입 목적에 맞춰 협의합니다. 평가 샘플은 문의로 안내드립니다.

출처 · 재현

결정론 컴파일 · 시드·리프가 같으면 같은 페어:
replay_hash sha256 (페어마다)
lockstep ATS leaf ↔ REDOUBT pair

해시-시일 모티프. 컴파일된 각 페어는 자신의 replay_hash로 만든 고유 인장을 함께 지닙니다.
카탈로그로
DIRTY ATLAS · 진단 · 파이프라인 QA 픽스처

진단 · 파이프라인 QA 픽스처

렌더 품질 회귀를 잡는 부정 픽스처. 잡혀야 할 잘못된 출력과 기대 게이트를 짝지어, 렌더·검증 파이프라인의 회귀 스위트를 구성합니다.

정체

fixture_type: render_quality_regression. 각 항목은 malformed_surface(잡혀야 할 입력)와 기대 게이트(gate)·기대 응답(reject)을 담습니다. fixture_status=active 인 것은 출시 전 hard-fail 대상입니다.

내용 · 구성

조사 누락 폴백, 라벨·본문 중복, 내부 가드 메시지 누출, 한·영 언어 잔존, 잘못된 JSON·CSS, 누락된 재현 해시, 금지 주장 단언, 위치 데이터의 수요 과장까지 — 실제로 잡았던 회귀를 픽스처로 보존합니다.

규모 (정직)

13 활성 픽스처 (샘플)

렌더 회귀 픽스처 13건(전부 fixture_status=active)으로 구성된 QA 샘플입니다. 대량 데이터셋이 아니라 회귀 스위트 — 파이프라인이 무엇을 막아야 하는지의 명세이며, 가산 확장됩니다.

핵심 스키마

bug_id
픽스처 식별자 (da_render_…)
gate
기대 게이트 (josa_fallback…)
lang
ko · en
malformed_surface
잡혀야 할 잘못된 출력
expected_engine_response
기대 응답 (reject)
fixture_status
active = 출시 전 hard-fail
샘플 — 실제 픽스처에서 발췌·축약

접근 · 라이선스

기관 문의 · inquiry

현재 QA 픽스처 샘플 단계입니다. 전체 회귀 스위트·통합 조건은 도입 목적에 맞춰 협의하며, 일부 항목은 준비 중 / 문의입니다.

출처 · 재현

결정론 회귀 · 각 픽스처는 게이트로 재현 검증:
regression_test_ref dirty-atlas-render-regression.mjs
gate scanRenderQuality()

해시-시일 모티프. 각 픽스처는 자신의 게이트·테스트 참조로 재현 검증되며, 산출물은 replay_hash 인장을 지닙니다.
카탈로그로