따르면 감시 Beating은(는) 이전 바이트 댄스 시드 팀 엔지니어 및 현재 베이징 대학 조교수인 장 치의 인터뷰에 따르면 바이트 댄스는 대형 모델 트레이닝(사전 트레이닝 및 후 트레이닝)을 약 6개월 정도 수행해야 한다고 밝혔습니다. 반면 구글은 소문에 따르면 단 3개월 만에 가능하다고 합니다. 장 치는 이러한 반복 속도가 중국 기업이 따라잡기 어려운 핵심적인 이유 중 하나라고 봅니다. 장 치는 약 1년간만 바이트에서 수학적인 팀의 연구 중심적인 특성으로 소개되었습니다. 그룹의 방향성은 "주로 홍보를 목적으로 한다"고 자신의 경험을 밝히며 사전 훈련 및 후훈련 팀과는 다릅니다.
장 치는 시드 내부의 벤치맥싱(점수 획득) 문화를 설명했습니다. 팀 리더는 책임 있는 벤치마크를 기반으로 실적을 평가하며 모든 사람들이 점수를 올리려고 노력하지만, "그것이 실제 사용에서 좋은 경험으로 변환되지는 않는다"고 말했습니다. 중국 대기업들의 모델은 이론상으로 미국의 선두 모델을 따라잡을 수 있다고 주장하지만, 실제로는 "불충분하다"고 말했습니다. 시드의 목표는 전 세계 최고 수준인데, "하지만 유감스럽게도, 우리가 따라잡은 것 같지 않습니다", 심지어 국내 1위의 목표조차 "실현되지 않았다고 생각합니다". 2024년 말에 시드는 GPT-4o에 따라잡은 것으로 자부했지만, 이후 DeepSeek가 출시되면서 팀은 여전히 격차를 깨달았으며, 그들은 강화 학습에 긴급히 초점을 맞추기 시작했다.