동찰 Beating 감시에 따르면 DeepSeek V4 기술 보고서가 처음으로 에이전트 후 훈련 및 대규모 평가를 지원하는 핵심 기반 시설을 최초로 공개했습니다. 프로덕션급 탄력성 계산 샌드박스 DSec(DeepSeek Elastic Compute)입니다.
현재 대형 모델 강화 학습은 매우 거대한 코드 실험 환경이 필요합니다. 보고서에 따르면, 실제 프로덕션에서 단일 DSec 클러스터는 수십만 개의 동시 샌드박스를 동시에 스케줄링할 수 있습니다. 시스템은 Rust로 작성되었으며, 핵심적으로 자체 개발한 3FS 분산 파일 시스템과 연동되어 계층별 온디맨드 로딩(on-demand loading)을 통해 대규모 샌드박스 콜드 스타트 성능 병목 현상을 극복했습니다.
개발자 경험 측면에서, DSec는 Python SDK를 사용하여 함수 호출, 컨테이너, 미니 가상 머신 및 전체 가상 머신 네 가지 실행 플랫폼을 하나의 인수 수정으로 전환하는 일관성을 제공했습니다. 연산 클러스터에서 흔히 발생하는 작업 강탈 문제에 대응하여, DSec는 글로벌 추적 로그를 도입했습니다: 작업 재개 시 시스템은 캐시된 명령 실행 결과를 직접 "패스트 포워드"하여 이미 저장된 것을 다시 실행함으로써 매우 빠른 중단점 계속 훈련을 실현하면서도 반복 실행으로 인한 비가벨 오류를 방지했습니다.