Schift Benchmarks

우리 기술은 벤치마크로 증명합니다.

OCR, 개인정보 마스킹, RAG 검색 품질, 벡터 엔진 속도를 같은 Schift 파이프라인 안에서 공개합니다. 데모가 아니라 실제 요청, 실제 문서, 실제 latency로 봅니다.

현재 공개 준비 중인 항목

32K

PII 단일 요청 characters 검증

92

PII processing chunks 검증

54.7%

Korean Legal RAG baseline

<300µs

Engine p50 search target

OCR

문서 이미지를 RAG가 읽을 수 있는 구조로 바꿉니다

ParseBench 준비 중

Schift OCR은 단순 텍스트 추출이 아니라 표, 차트, 레이아웃, 근거 위치를 함께 보는 문서 이해 파이프라인입니다. 공개 벤치마크는 OCR 품질을 텍스트 유사도 하나로 숨기지 않고, 실제 RAG 입력으로 쓸 수 있는지까지 검증하는 방향으로 정리합니다.

  • Tables / Charts / Content Fidelity / Semantic Format / Grounding 축 공개
  • 한국어 문서와 스캔 PDF 중심 평가
  • 업로드 → OCR → 검색 근거까지 이어지는 end-to-end 품질 측정

PII

한국어 개인정보를 빠르게 찾고, 안전하게 마스킹합니다

32K characters smoke test

Schift PII는 한국어 OCR 텍스트에서 개인정보를 빠르게 탐지하고 마스킹하는 경량 런타임입니다. 현재 한국어 OCR smoke test 기준 32,000 characters까지 단일 요청으로 검증했습니다.

  • 유저당 100 calls 무료 테스트 제공 예정
  • entities / masked / both 응답 모드
  • 만족·불만족 피드백 기반으로 탐지 실패 케이스 개선

RAG Bench

검색 품질은 데모 문장이 아니라 벤치마크로 증명합니다

Legal 54.7%

Schift는 문서 업로드 후 답변이 그럴듯한지 보는 데서 멈추지 않습니다. 질문 분해, 리랭킹, 근거 polarity, verbatim evidence까지 포함해 실제 업무형 RAG가 맞는 근거를 찾는지 평가합니다.

  • 한국 법률 RAG baseline: Qwen3-8B SOTA 대비 +13.2pp
  • 4-hop multi-hop retrieval과 cross-domain decision-review 검증
  • 검색 결과, 근거, 판단 경로를 분리해 관찰

Engine Speed

벡터 검색 엔진은 빠르고, 제품 병목은 다른 곳까지 봅니다

sub-300us p50

Schift Engine은 Rust 기반 벡터 검색 엔진입니다. SQ8 압축, WAL, persistence, compaction을 포함하면서도 1M vectors 기준 sub-300us p50 search latency를 목표로 설계했습니다. 동시에 실제 제품에서는 LLM, reranker, network latency까지 함께 측정합니다.

  • 1M vectors 기준 FAISS 대비 p50 / p99 tail latency 비교
  • 4x SQ8 compression으로 메모리 비용 절감
  • RAG pipeline 전체 latency profile 공개

PII API Testing

한국어 PII API부터 공개 테스트합니다.

현재 테스트 기간에는 유저당 100 calls를 무료로 제공합니다. Schift API로 호출하고, 탐지 결과에 만족/불만족 피드백을 남기면 실패 케이스를 우선적으로 개선합니다.

무료 테스트
100 calls / user
과금 기준
characters / tokens 검토
추가 사용량
문의 기반 확장
PII API / Claude Skill 버전 문의