Schift Benchmarks

말은 쉽습니다.
숫자는 못 속입니다.

OCR, PII, RAG 검색, 엔진 속도 — 주장이 아니라 실측값으로 답합니다.

측정 항목

OCR PII RAG Bench Engine Speed

7종

PII 지원 항목

F1 95

PII 목표 정확도

54.7%

한국 법률 검색 정확도

<300µs

검색 p50 목표

OCR

검색 근거 위치 평가

스캔 PDF와 표를 읽어, 글자와 구조가 검색 근거로 그대로 남는지 측정합니다.

문자 정확도
표 구조
근거 위치

PII

F1 95 목표

한국어 문서에서 반드시 가려야 할 개인정보 7종, 놓치지 않는지 봅니다.

주민등록번호
외국인등록번호
여권번호
운전면허번호
주소
전화번호
계좌번호

RAG Bench

Legal 54.7%

질문에 대한 정답 근거를 실제로 찾아오는지 측정합니다.

한국 법률 검색 54.7%
Qwen3-8B 대비 +13.2%p

Engine Speed

sub-300us p50

100만 건 벡터에서 검색이 얼마나 빠른지, p50 지연으로 잽니다.

100만 건 기준
p50 sub-300us 목표

OmniDocBench-KO

한국어 문서 OCR 정확도

5개 문서 유형별 텍스트 정확도(=100·(1−편집거리), 인쇄·수식은 latexnorm CER 기준). 표·HTML 마크업을 동일 정규화한 뒤 공정 비교했습니다.

Schift (self-host) 상용 API 오픈소스

일반 문서 n=100

Schift-OCR

86.1

CLOVA OCR

97.5

Upstage

95.5

Gemini 3.1

88.9

PaddleOCR-VL 1.6

92.7

MinerU 3.4

91.7

표·금융 n=60

Schift-OCR

68.8

CLOVA OCR

70.4

Upstage

67.2

Gemini 3.1

PaddleOCR-VL 1.6

61.8

MinerU 3.4

28.6

슬라이드 n=100

Schift-OCR

85.9

CLOVA OCR

92.8

Upstage

92.4

Gemini 3.1

91.3

PaddleOCR-VL 1.6

86.1

MinerU 3.4

82.6

필기·옛공공 n=80

Schift-OCR

92.1

CLOVA OCR

87.7

Upstage

85.5

Gemini 3.1

92.6

PaddleOCR-VL 1.6

84.1

MinerU 3.4

77.3

인쇄·수식 n=100

Schift-OCR

25.1

CLOVA OCR

38.5

Upstage

51.5

Gemini 3.1

74.9

PaddleOCR-VL 1.6

83.1

MinerU 3.4

61.5

※ 텍스트 정확도 외에 Schift는 DocLang 구조 출력과 읽기순서(reading-order) 편집거리 0.006을 제공합니다 — 상용 API·오픈소스에는 없는 축입니다. self-host라 페이지당 과금이 없고 문서가 외부로 나가지 않습니다.

PII Masking

내 문장으로 직접 확인하세요.

텍스트를 붙여넣으면 무엇을 어떻게 가리는지 바로 보입니다. 한국어 개인정보 7종, 가입 없이 무료로.

무료 데모: 분당 30회 / 일 500회
지원 항목: 7종
API / Skill: 문의 후 확장

지금 바로 테스트하기

말은 쉽습니다.숫자는 못 속입니다.

OCR

PII

RAG Bench

Engine Speed

한국어 문서 OCR 정확도

내 문장으로 직접 확인하세요.

말은 쉽습니다.
숫자는 못 속입니다.