简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

「훌라웨이 칩이 DeepSeek V4 출시를 지연했나요」? 동일한 커널에서 AMD와 NVIDIA 성능을 향상시킨 인공지능 가속기는 거의 2배 빨라졌습니다.」

딥감지 V4가 출시되기 전에 딥감 Beating의 모니터링에 따르면 커뮤니티에서 V4의 예상보다 늦은 온라인 시간은 모델이 NVIDIA에서 华웨이 AI Accelerator로 이관되는 동안 적응에 어려움을 겪어 지연되었을 것이라는 추측이 널리 퍼졌습니다. V4 기술 보고서는 이 소문에 직접 대답하지는 않았지만 공개된 성능 데이터는 명백하게 이와 모순됩니다.

보고서에 따르면, V4의 세분화된 전문가 분할 스키마(Fine-Grained EP Scheme)는 NVIDIA GPU와 华웨이 AI Accelerator NPU 이중 플랫폼에서 배포가 확인되었으며, 일반 추론 부하가 1.50~1.73배 가속되었으며, RL rollout 및 고속 Agent 서비스와 같은 지연에 민감한 시나리오에서는 최대 1.96배 가속이 이루어졌습니다. 팀은 CUDA 버전 내부 커널 MegaMoE를 DeepGEMM의 일부로 공개했습니다. 다시 말해, V4는 두 세트의 하드웨어에서 거의 이론적 한계에 도달하는 효율을 보여주었으며, 크로스 플랫폼 적응은 성능 하락을 일으키지 않았습니다.

오류 신고/제보

인기 기사

업계 내 오리지널 Yang Hee-pyo의 비관적인 시나리오: 비트코인과 암호화폐의 최종 단계

대화 페이팅: 비트코인은 디지털 골드가 아니라 AI 자산입니다

시가 총액이 97% 하락한 후, iQIYI는 AI를 활용하여 강제로 생존하려고 합니다.

인텔 주가 20% 급등, CPU는 에이전트 시대에 잃어버린 것을 모두 되찾아야 함

온체인 탐정이 지속적으로 감시합니다

49분 전

인텔의 애프터마켓 상슨은 23%로 확대되었으며, 온체인 최대 숏 기간 수익은 92만 달러로 달성되었습니다.

1시간 전

BTC 메인 숏 포지션 헤지주문 및 포지션 정리가 79,000달러에서 이뤄졌으며, 가격 상승 후 재진입하여 숏 포지션을 다시 설정할 계획입니다.

1시간 전

테더(Tether)는 지난 주에 이더리움 네트워크 상에 30 억 개의 USDT를 추가 발행했습니다.

1시간 전

Pacifica가 현물 거래 및 통합 마진 시스템을 출시하여 헤지 트레이더가 현물 및 계약 포지션을 보유할 때 통합 계정 순 잔액 정산을 수행합니다.

24H중요 정보

2026-04-24

중국 외교부: 중국은 미국의 중국 인공지능 산업 발전 성취물을 중상하는 비난에 단호하게 반대한다.

DeepSeek V4이 미국에서 양진 갈등을 일으켰습니다. 한 쪽은 이 기술이 금지된 칩에 의존해 6개월이나 뒤처진 것으로 평가하고 있으나, 다른 쪽은 신기술을 추구한다고 설명하고 있습니다.

DeepMind 연구원은 DeepSeek V4의 지연 원인을 추측했습니다. 교육 데이터가 33T로 두 배로 증가하여 심각한 불안정성을 유발했다고 합니다.

빈란스 지갑: 오늘 오후 5시에 알파 에어드랍 수령이 시작될 예정이며, 입장 임계값은 228포인트입니다.

오류 신고/제보

제출

새 문고 추가

자신만 보기

공개

저장

문고 선택

새 문고 추가

취소

완료