DeepSeek V4이 미국에서 양진 갈등을 일으켰습니다. 한 쪽은 이 기술이 금지된 칩에 의존해 6개월이나 뒤처진 것으로 평가하고 있으나, 다른 쪽은 신기술을 추구한다고 설명하고 있습니다.

따르면, Beat Dynamic Beating의 모니터링 결과, 미국 외교 관계 위원회(CFR) 중국과 신생 기술 고급 연구원 Chris McGuire(이전 백악관 국가 안보 회의, 국방부 구성원)가 V4가 미국 중국 인공 지능(AI) 경쟁 격자를 변화시키지 않았다고 주장했습니다. 그는 V4 보고서 원문에서 인용하여, DeepSeek 자체가 추론 능력이 「전방 모델보다 약 3~6개월 뒤떨어졌다고 인정했으며, 참조 모델은 반년 전에 출시된 GPT-5.2와 Gemini 3.0 Pro입니다. 그는 또한 V4 보고서가 NVIDIA GPU와 Huawei Ascend NPU에 적합한 추론 엔드포인트를 밝히지만, 실제 사용된 GPU 모델과 비용은 공개하지 않았다는 점을 질문했습니다(V3에서는 2000매의 H800을 사용하며, 비용은 557만 달러로 발표되었습니다). 이는 제어 출력이 제한되는 NVIDIA Blackwell 칩을 사용했음을 암시하고 있다고 생각합니다. 이전에 미국 정부 관리는 2월에 유사한 주장을 익명으로 했으며, NVIDIA는 「곡올」이라고 말했습니다. DeepSeek는 Blackwell을 사용하지 않았다고 주장하며, 모델은 NVIDIA H800 및 Huawei Ascend 910C에서 훈련되었음을 밝혔습니다.

Replit CEO Amjad Masad는 미국 정치인과 로비스트가 「중국 증류」 공포를 선동하는 동안 중국 과학자들이 진정한 AI 성과를 공유하고 있다고 맞서며 발언했습니다. 그는 DeepSeek 공식 트윗에 기술적 혁신으로 나열된 구조적 혁신을 인용했는데, 이는 token 수준의 주의 집중력 압축(DeepSeek Sparse Attention) 및 긴 맥락 계산 효율의 큰 개선을 포함하며, Masad는, V4-Pro가 1M 맥락에 있을 때의 단일 토큰 추론 처리 능력과 KV 캐시 사용이 V3.2보다 훨씬 낮다고 지적했습니다. Masad는 이러한 종류의 아키텍처 수준의 혁신이 훈련 데이터 증류와는 전혀 무관하며, 누구나 오픈 소스로부터 이점을 얻을 수 있다고 믿습니다, 미국의 모든 규모의 실험실을 포함하여.

원문 링크

오류 신고/제보