AI AI
속보
심층
이벤트
더보기
자금 조달 정보
특집
온체인 생태계
용어
팟캐스트
데이터
OPRR
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
BTC
$96,000
5.73%
ETH
$3,521.91
3.97%
HTX
$0.{5}2273
5.23%
SOL
$198.17
3.05%
BNB
$710
3.05%
XRP
$2.25
2.07%
DOGE
$0.325
2.23%
USDC
$0.999
3.05%

그 AI 대형 모델에 레이블을 지정하는 시골 청년들

이 글을 읽으려면 25 분
기술 혁명의 근간은 항상 대규모 싼 노동력 소비입니다
글 | Sleepy.md


샤누이 대통(山西大同)은 과거 석탄으로 번영했던 도시로, 이제 석탄가루를 떨어트리고 뾰족한 쇠파쇄로 또 다른 무형의 광산을 향해 내리친다.


진무권 금무력국족(平城区金贸国际中心)의 오피스빌딩 안에는 더 이상 승강도가 없고, 석탄 운반 차량도 없다. 그 자리를 대신해 수천 개의 밀접히 배열된 컴퓨터 작업자 위치가 차지했다. 상해 룬쉰 윈 중성골 대수거 빅데이터 지능적 서비스 기지는 건물 전체 여러 층을 점령했고, 수천 명의 헤드폰을 착용한 젊은 직원들이 화면을 응시하며 클릭하고, 드래그하고, 사각형을 그리고 있다.


공무부 자료에 따르면, 2025년 11월까지 샤누이시는 이미 서버 74.5만 대를 구축하고, 69개의 콜 아노테이션 데이터 기업을 유치하여 3만 명 이상의 근로자가 근로하게 했으며, 75억 위안의 가치를 창출했다. 이 숫자 광산 속에서 일하는 근로자의 94%는 모두 현지 출신이다.


샤누이뿐만 아니라, 국가통계국이 지정한 최초의 데이터 주석 기지에서는 산시 영헤현(永和县), 구이저 바이저(贵州毕节), 윈남 몽쯔(云南蒙自) 등 중서부 군역시가 놀랍게도 포함되어 있다. 영헤현의 데이터 주석 기지에서는 직원 80%가 여성이다. 그들은 대부분 농촌 엄마이거나 적절한 일자리를 찾지 못한 귀향 청년이다.


백 년 전에 영국의 맨체스터 직조 공장은 땅을 잃은 농부들로 북적였다. 그리고 오늘날, 이러한 외진 군도시의 컴퓨터 스크린 앞에는 산업경제에서 자리를 찾지 못한 젊은이들이 가득하다.


그들은 미래 지향적이면서도 극도로 원시적인 조각 작업을 하고 있는데, 이는 중국, 심천, 실리콘밸리에서 인공지능 거물들을 위해 필수적인 데이터 먹이를 생산하기 위함이다.


아무도 이것이 문제라고 생각하지 않는다.


황토고원 위의 새로운 생산라인


데이터 주석의 본질은 기계에게 세계를 가르치는 것이다.


자율 주행은 신호등과 보행자를 인식해야 하며, 대규모 모델은 고양이와 개를 구별해야 한다. 기계 자체에는 상식이 없기 때문에, 사람이 먼저 이미지에 상자를 그리고, "이것은 보행자다"라고 알려줘야만 한다. 그러면 기계는 천만 장의 이미지를 소화한 후, 스스로 인식하는 법을 익힐 수 있다.


이 일은 학력보다는 인내심과 계속 클릭할 수 있는 검지가 필요하다.


2017년 황금 시대에는 간단한 2D 상자 하나에 가격이 1.2센트에 이르기도 했고, 심지어 5센트의 높은 가격을 지불하는 회사도 있었다. 손빠른 주석 작업자는 하루에 열시간 이상 일한다면 오백에서 육백 위안을 벌 수 있다. 군도시에서 이것은 꽤나 높은 급여이며 품위 있는 직업이라고 볼 수 있다.


그러나 대규모 모델의 발전으로 인해이 생산 라인의 잔인한 면이 드러나기 시작했습니다.


2023 년에는 간단한 이미지 주석의 단가가 이미 3~4 센트로 떨어져 90% 이상 하락했습니다. 더 어려운 3D 포인트 클라우드에도 마찬가지입니다. 밀도가 높은 포인트로 이루어진, 가장자리를 분명히 보려면 수백 배를 확대해야하는 이미지에게 주석 작업자는 차량이나 보행자를 완벽하게 둘러 싸는 길이, 너비, 높이 및 회전 각도가 포함 된 3D 상자를 3D 공간에서 그릴 필요가 있습니다. 그러나 이러한 복잡한 3D 상자의 가격은 겨우 5 센트뿐입니다.



단가 폭락의 직접적인 결과는 노동 강도의 급증입니다. 매달 2~3 천 원의 기본 급여를 유지하기 위해 주석 작업자는 계속해서 속도를 높여야만 합니다.


이것은 정말 쉬운 화이트 칼라 직업이 아닙니다. 많은 주석 기지에서는 업무 시 전화 통화를 허용하지 않으며, 휴대 전화는 사물함에 잠그세요. 시스템은 모든 직원의 마우스 이동과 머무는 시간을 정확히 기록하며, 3 분 이상 멈추면 백그라운드에서 경고가 채찍 처럼 휘둘러집니다.


더 이상 발할 수 없는 용납 한도가 더욱 극심합니다. 업계의 합격 기준은 일반적으로 95% 이상으로, 일부 회사들은 98%~99%를 요구합니다. 이것은 100 개의 상자를 그리는 경우에도 2 개를 잘못 그리면 전체 이미지가 반송되어 수정되어야 함을 의미합니다.


동적 이미지는 연속된 프레임으로, 차선 변경 차량이 가리워져 있고, 주석 작업자는 그것들을 하나씩 연상하여 찾아야 합니다. 3D 포인트 클라우드 이미지에서 10개를 초과하는 포인트가있는 객체는 상자를 그려야만 합니다. 복잡한 주차장 프로젝트에서 선이 길거나 누락되면 검수에서 항상 결함을 찾을 수 있습니다. 한 장의 이미지가 여러 번 수정되는 것은 흔한 현상입니다. 마지막으로 계산을 해보면 한 시간의 노력으로 겨우 몇 센트를 받을 수 있습니다.


푸저우의 한 주석 작업자가 자신의 정산표를 소셜 미디어에 공개했습니다. 일한 날에 그녀는 700 개 이상의 상자를 그렸고, 단가는 4 센트이며, 총 수입은 30.2 위안입니다.


이것은 매우 분열 된 장면입니다.


한쪽에는 발표회에서 빛나는 기술 거물들이 있으며 AGI가 어떻게 인류를 해방시킬지에 대해 논의합니다. 다른 한편에는 황토 고원과 서남 대 산맥의 시군구에서 젊은이들이 매일 화면을 8~10 시간 동안 응시하며 기계적으로 상자를 그리고, 수천 개, 심지어 밤에 꿈을 꾸면서도 손가락은 공중에서 차선을 그리고 있습니다.


어떤 사람이 한번 말했습니다. 인공 지능의 겉모습은 시커먼 스포츠 카입니다. 그러나 문을 열면 그 안엔 100 명의 사람들이 자전거를 타고 있으며, 이를 위해 목숨을 걸고 페달을 밟고 있습니다.


아무도 이것에 문제가 있다고 생각하지 않았다.


기계에게 '사랑하는 법'을 가르치는 계량공


이미지 인식의 병목 현상이 극복되면서 대규모 모델은 보다 심층적인 진화를 거듭, 인간과 같이 사고하고 대화하며 심지어 '공감능력'까지 나타내야 했다.


이는 대규모 모델 훈련의 가장 핵심적이면서도 가장 비싼 단계인 RLHF(인간 피드백에 기반한 강화 학습)을 낳았다.


간단히 말해, 인간이 AI가 생성한 답변을 점수 매기도록 하여 어떤 답변이 더 나은지, 더 인간적인 가치관과 감정 선호에 부합하는지 알려주는 것이다.


ChatGPT가 '인간 같이' 보이는 이유는 그 뒤에 무수히 많은 RLHF 주석 작업자들이 가르치고 있기 때문이다.


크라우드소싱 플랫폼에서는 이러한 주석 작업이 일반적으로 명시적으로 가격이 표시된다: 단일 단가는 3~7달러이다. 주석 작업자는 AI의 답변을 매우 주관적으로 감정적으로 평가하여 이 답변이 '따뜻한지', '공감능력이 있는지', '사용자의 감정을 고려했는지'를 판단해야 한다.


천 두세천 달러 월급을 받으며 현실의 진창 속에서 바쁘게 달리고, 자신의 감정조차 소홀히 여길 여유조차 없는 하찮은 노동자는 시스템에서 AI의 감정 멘토 및 가치관 심판으로 행동해야 한다.



그들은 따뜻함, 공감능력과 같은 매우 복잡하고 섬세한 인간 감정을 강제로 분쇄하여 1에서 5까지의 냉정한 점수로 측정해야 한다. 그들의 점수가 시스템의 기준 답안과 일치하지 않으면 정확도가 충분하지 않다고 판단되어 이미 미약한 단가가 차감된다.


이것은 인지적 휴면이다. 인간의 복잡하고 미묘한 감정, 도덕과 연민은 알고리즘의 깔깔대는 통에 강제로 끌려들어간다. 차가운 측정 및 표준화 된 척도 속에서, 그것들은 마지막 한숨을 다 빼앗긴다. 화면 속 사이버 거인이 시를 지을 수 있고 음악을 만들며 따뜻한 질문을 할 뿐만 아니라 애절한 피부를 입을 수 있다는 사실에 경탄할 때; 화면 밖, 그 천연덕 좋은 인간들은 감정이 없는 점수 기계로 퇴화되어 매일같은 기계적인 심판 속에서 존속해 있다.


이것은 전체 산업 체인의 가장 은밀한 면이며, 어떤 자본 조달 뉴스나 기술 화이트페이퍼에도 절대 나타나지 않는다.


아무도 이것에 문제가 있다고 생각하지 않았다.


985 마스터와 작은 도시 청년


하부의 끼개 작업이 AI의 궤도에 의해 짓눌림으로써, 이 사이버 흐름의 생산라인은 위로 번식하기 시작하며 더 높은 차수의 두뇌 노동을 삼켜간다.


대형 모델의 욕구가 변했습니다. 더 이상 간단한 상식을 씹어 먹는 데 만족하지 않고 인간의 전문지식과 고차 논리를 삼켜야 합니다.


주요 채용 플랫폼들에서 특별한 종류의 파트타임 직업이 자주 등장하기 시작했습니다. 예를 들어 "대형 모델 논리 추론 주석" 및 "AI 인문학 트레이너"와 같은 직종입니다. 이 직종의 기준은 매우 높으며 "985/211 대학원 이상 학위"가 요구되며 법률, 의학, 철학, 문학 등의 전문 분야를 다룹니다.


많은 명문 대학원생들이 끌려들어 이러한 대기업의 외주 그룹에 몰리기 시작했습니다. 그러나 그들은 곧, 이것이 사실 쉬운 지식적 놀이가 아니라 영혼의 고통임을 깨닫게 되었습니다.


정식으로 작업을 시작하기 전에, 그들은 등급 차원 및 판단 기준 파일을 수십 페이지에 걸쳐 읽어야 하며 두 번에서 세 번의 평가를 거쳐야 합니다. 기준을 충족하면, 공식적인 주석에서 평균보다 낮은 정확도를 보이면 자격이 박탈되어 그룹 채팅에서 추방됩니다.


가장 숨막힌 것은, 이러한 기준이 전혀 일정하지 않다는 것입니다. 비슷한 문제와 답안에 직면했을 때, 동일한 사고 방식을 사용하여 평가를 한 결과가 극명하게 다를 수 있습니다. 이는 끝없이 풀 수 없고 절대적인 정답이 없는 시험지를 푸는 것과 같습니다. 과연 능력을 향상시키려는 자가 없고 공부로도 정확도를 높일 수 없으며 혼신을 다해 머무르고 뇌와 체력을 소모해야 합니다.


이것이 대형 모델 시대의 새로운 유형의 착취 - 계급 붕괴입니다.


지식, 이전에 장벽을 뚫고 상승하는 황금 비철로 여겨졌던 것은 이제 더 복잡하게 씹히는 알고리즘에게 바쳐진 디지털 식물 먹이가 되었습니다. 알고리즘과 시스템의 절대적인 권력 앞에서 985 대학원생의 상징적인 타워는 토목의 마을 청년과 함께 가장 기이한 동일한 운명을 맞이하게 되었습니다.


그들은 함께 이 깊이 보이지 않는 사이버 광산 구덩이로 추락하며 영광을 박탈당하고 차이가 지워져 모조화되어 기어로 변할 수 있는 톱니바퀴로 변해버렸습니다.


해외에서도 상황은 비슷합니다. 2024년, 애플은 산디에고에 있는 121명의 AI 음성 주석팀을 직접 해산했습니다. 이들 직원들은 Siri의 다국어 처리 능력을 향상하는 업무를 맡고 있었으며, 대기업의 핵심 비즈니스 가장자리에 서 있을 줄로 생각했지만 순식간에 실직의 심연으로 추락했습니다.


기술 거물들에게는, 시가 소형 마을의 큰 주부부터 명문 대학 졸업의 논리 트레이너까지 핵심적으로 "소모품"으로 언제든지 교체할 수 있는 존재입니다.


아무도 이것에 문제가 있다고 생각하지 않습니다.


조선 탑의 고도, 몇 푼짜리 피 땀과 노고로 쌓은


중국 정보 통신 연구소에 따르면, 2023년 중국의 데이터 주석 시장 규모는 608억 위안에 이르렀으며, 2025년에는 200~300억 위안으로 예상되며, 2030년까지 전 세계 데이터 주석 및 서비스 시장 매출은 1171억 위안까지 치솟을 것으로 예상됩니다.


이 숫자들 뒤에는 OpenAI, 마이크로소프트, 바이트댄스 등 기술 거물들이 수천억 달러 또는 수조 달러에 이르는 평가 약속 속의 파티가 숨어 있다.


하지만 이 환상적인 부는 실제로 인공지능을 '먹여주는' 사람들에게로 흘러가지 않았다.


중국의 데이터 주석 산업은 전형적인 역뒤집힌 피라미드 아웃소싱 구조를 보여준다. 최상층에는 핵심 알고리즘을 쥐고 있는 기술 거물이 있으며, 두 번째 층에는 대기업 데이터 서비스 공급업체가 있고, 세 번째 층에는 각지의 데이터 주석 기지와 중소 규모 아웃소싱 기업이 있으며, 가장 아래층에는 계량 노동자 주석 사용자만이 있다.


각 아웃소싱 층은 계층적으로 이익을 다져내야 한다. 대기업이 제시하는 단가가 5毛이면, 층층이 들이받은 뒤 군소시 주석 사용자가 받을 금액은 아마도 5점도 안 될지도 모른다.


그리스 전 재무장관인 야니스 바료파키스는 자신의 책인 《기술 봉건주의》에서 현격한 관점을 제시했다: 오늘날의 기술 거물은 더 이상 전통적 의미의 자본가가 아니라 '클라우드 귀족'이다.


그들이 소유한 것은 공장과 기계가 아니라 알고리즘, 플랫폼, 컴퓨팅 파워이며, 이것들은 사이버 시대의 디지털 토지이다. 이 새로운 봉건주의 제도에서 사용자는 소비자가 아니라 디지턍 노비인데, 우리가 소셜 미디어에서 한 좋아요, 댓글, 조회는 모든 것을 클라우드 귀족에 대한 무료 데이터로 제공한다.


하철시장에서 대기한 클라우드 귀족은 이 제도의 맨 아래 층의 디지턍 노예이다. 그들은 데이터를 생산하는 것뿐만 아니라 대규모 원본 데이터를 정리, 분류, 평가하면서 고품질 사료로 변환해 대규모 모델이 소화할 수 있는 상태로 하는 것을 가해야 한다.


이것은 비밀스러운 인지 땅 소유 운동이다. 마치 19세기 영국의 땅 소유 운동이 농부들을 직업 공장으로 몰아넣은 것처럼, 오늘날의 AI 파도는 실 모습 경제에서 자리를 찾을 수 없는 젊은이들을 화면 앞으로 몰고왔다.


AI가 계층간 격차를 줄이는 것이 아니라 중요한지를 바로 세운 「데이터와 혈암 수송벨트」를 통해 중국 중서부 현시혈시부터 평양과 관셴의 기술 거물 본사로 향한 일련의 과정이다. 기술적 혁명의 서사는 언제나 웅장하고 아름다우며 그 기저 중요한 것은 늘 저렴한 노동 인력의 규모가 소몰된다.


누구라도 이것을 문제로 생각을 하지 않는다.


데이터 주석이 더 이상 인간이 필요하지 않은 날


가장 잔혹한 결말이 근접해 오고 있으며, 그 속도가 점점 더 빨라지고 있다.


대규모 모델 기능의 상승으로, 이제는 인류가 밤낮으로 일하며 완성해야 했던 주석 작업이 AI 자체에 의해 대동하고 있다.


2023년 4월, 이데아차의 창립자 이상은 포럼에서 공개한 정보에 따르면, 과거에 이데아차는 약 1000만 프레임의 자율 주행 이미지 주석을 완료하기 위한 노동을 수행하고, 아웃소싱 비용은 10억에 가까웠다. 그러나 대모델을 사용한 자동 주석 후에, 과거에 1년이 걸렸던 일은 기본적으로 3시간이면 완료할 수 있다.


효율성은 인간의 1000배이며, 그것은 이미 2023년에 있었습니다. 방금 지난 3월에 이상은 새로운 세대의 MindVLA-o1 자동 주석 엔진을 출시했습니다.


업계에는 "얼마나 많은 지능이 있는지, 거기에만큼 많은 인공이 있다"는 매우 진실한 자조가 전해지고 있습니다. 그러나 지금은 대기업들이 데이터 주석 외부 위탁에 투자한 금액이 40%~50% 갑작스럽게 감소했습니다.


컴퓨터 앞에서 무수히 많은 밤낮을 앉아 땀을 흘리며 눈을 붉게 희우고 지낸 그 작은 마을 청년들은 자신의 손으로 거대한 괴물을 키워왔습니다. 그리고 이제, 이 거대한 괴물이 돌아볼 차례가 왔으며, 그들의 밥그릇을 무채로 깨부술 것입니다.


어둠이 내리면, 대동평정구의 사무실 건물은 여전히 창백한 밤과 같았습니다. 교대하는 젊은이들은 엘리베이터 안에서 침묵하며 피로한 육체를 서로 맡겼습니다. 이 다각형 상자에 갇힌 접힘된 공간에서는, 먼 대서양의 Transformer 아키텍처가 어떤 역사적인 전이를 겪고 있는지에는 관심이 없으며, 수백억 개의 매개변수 뒤의 계산 능력 소음도 들을 수 없었습니다.


그들의 시선은 "합격선"을 나타내는 후면의 빨간색과 녹색 진행 막대에 끈끈이 붙어 있으며, 월말에 얻은 몇 점, 몇 센트의 계획된 숫자로 살만한 삶을 조금이라도 이룰 수 있는지를 계산하고 있었습니다.


한편에는 나스닥의 야훼 소리와 기술 미디어의 논평이 있으며, 거물들은 인공 일반 지능의 출현을 축하하는 한잔을 들이키고 있습니다. 그리고 다른 한편으로, 이 자신의 손으로 길러낸 거대한 괴물에게 피를 빨리며 AI를 지탱하는 디지털 노예들은 그들 스스로에게 보통 날을 꼽았던 어느 사소한 아침에, 관심 없이 그 밥그릇을 차례로 박살 내며, 꿈틀거리는 균형을 잡고 있습니다.


아무도 이것에 어떤 문제도 느끼지 않았습니다.


BlockBeats 공식 커뮤니티에 참여하세요:

Telegram 구독 그룹:https://t.me/theblockbeats

Telegram 토론 그룹:https://t.me/BlockBeats_App

Twitter 공식 계정:https://twitter.com/BlockBeatsAsia

举报 오류 신고/제보
문고 선택
새 문고 추가
취소
완료
새 문고 추가
자신만 보기
공개
저장
오류 신고/제보
제출