AI AI
속보
심층
이벤트
더보기
자금 조달 정보
특집
온체인 생태계
용어
팟캐스트
데이터
OPRR
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
BTC
$96,000
5.73%
ETH
$3,521.91
3.97%
HTX
$0.{5}2273
5.23%
SOL
$198.17
3.05%
BNB
$710
3.05%
XRP
$2.25
2.07%
DOGE
$0.325
2.23%
USDC
$0.999
3.05%

a16z AI 분야 파트너의 8년 창업 노트

이 글을 읽으려면 18 분
생성주의 AI의 첫 단계가 마무리 단계에 접어들고 있으며, 산업은 제품화 및 규모 경쟁으로 전환하고 있습니다.
원문 제목: Notes From 8 Years as a Founder in Generative AI
원문 작성자: @lishali88
번역: Peggy, 블록비츠


편집자 주: 본문은 생성적 AI의 창업자인 한 사람의 8년 회고록입니다. GPT가 나오기 전인 2018년에 Rosebud AI를 설립하였으며, "창작을 게임처럼 간단하게" 하는 것을 목표로 TokkingHeads를 포함한 여러 AI 창의 도구를 연이어 출시했습니다. 모델 능력이 아직 성숙하지 않은 단계에서 이러한 제품들은 디자인 프로세스와 상호작용을 통해 "불편하지만 사용하기 좋은" 경험을 확대하여 초기 사용자 유치와 제품 검증을 완료했습니다.


이 경험은 생성적 AI가 "합성 미디어"에서 일반적 능력 기반 인프라로의 완전한 진화 주기를 거의 모두 포괄합니다: CycleGAN, StyleGAN의 실험적 탐색부터 GPT-4가 코드 생성과 상호작용적 창작의 경계를 넓히는 것, 기술 진보가 지속적으로 제품 로직과 창업 리듬을 재작성했습니다. 작가의 경로는 또한 모델이 변수로서 중요해지면서 진정한 전환점이기 때문에 기술 그 자체뿐만 아니라 이를 기반으로 제품을 구축하고 전파하며 상업화하는 방식이 중요해졌다는 보다 명확한 구조적 변화를 반영합니다.


CEO 직무를 사임하고 a16z에 합류한 후, 작가는 전선 모델 스택 및 관련 인프라에 중점을 두는 투자로 전환할 것입니다. 그러나 개별 경로보다는 더 중요한 것은, 이 8년 동안의 경험이 형성되어가는 추세를 가리키는 것입니다: 생성적 AI의 첫 번째 단계(무엇을 할 수 있는지 입증)가 끝나가고 있으며, 이어지는 것은 능력이 어떻게 조직화되고 제품화되며 최종적으로 실제 세계로 진입되는지에 대한 보다 긴 주기의 경쟁입니다.


아래는 원문입니다:


저는 a16z에 합류하여 파트너로 임명되어 인프라 및 AI 분야 투자에 초점을 맞출 것입니다. 동시에, Rosebud AI를 8년간 이끌고 CEO 직무를 떠나게 되었습니다.


다음은 이 8년간의 몇 가지 회고와 반성입니다. 아직 현업에서 제품을 구축 중인 사람들에게 깊은 존경을 표합니다. 모델 하나의 출시는 기존의 제품 로드맵을 흡수할 수도 있고, 그것을 몇 년 앞당길 수도 있습니다. 디자인, 제품, 엔지니어링 - 이러한 기능들의 형태는 3개월 전과 비교했을 때도 이미 변화했으며, 8년 전과 비교하면 더욱 그렇습니다. 기술 발전의 속도는 이 시대를 가장 흥미진진한 창업 시기로 만들었지만, 동시에 가장 도전적인 시기로 만들기도 합니다.


a16z에서는 전선 모델 스택에 초점을 맞추어야 합니다: 모델 자체뿐만 아니라 모델 주변에 구축된 인프라와 개발 도구를 포괄합니다. 모델 능력의 빠른 진화에 흥분하고 있으며, 점점 더 많은 진전이 AI 그 자체에 의해 이루어지고 있습니다. 또한, 지난 8년 동안 AI 창의 도구를 개발해온 것으로 인해 이 분야에 특히 흥미를 느끼고 있습니다.


이전에도 일부 시드 투자에 천사 투자자로 참여한 경험이 있습니다. 이는 @fal, @periodiclabs, @SakanaAILabs 및 @ExaAILabs를 포함합니다. 앞으로는 이 기술 스택을 구축하고 있는 창업가들을 지원하는 데 모든 노력을 기울일 수 있기를 고대하고 있습니다.


2018년: GPT 등장 이전, 생성적 AI에 베팅하기



2018년 11월, 나는 CycleGAN을 사용하여 <Myst> 게임 화면을 처리하고 숲을 열대 우림으로 변환하는 실험 비디오를 만들었습니다.

생성적 AI 분야에서 창업을 하는 데에는 8년이란 꽤나 오랜 세월이 걸렸습니다.


2018년 말부터 시작했을 때, 거의 그게 고대 시대였던 것 같습니다. 당시에는 이 분야가 "합성 미디어(synthetic media)"로 알려졌었습니다. CycleGAN과 StyleGAN을 다루며 생산해낸 콘텐츠는 이상하면서도 매혹적이었습니다. 이를 통해 언젠가 어떤 날, 창작이 게임 안의 건축 모드처럼 술술 잘 풀린다고 믿을 수 있었습니다("rosebud"라는 이름 또한 The Sims 시뮬레이션의 이름에서 따왔습니다).


창작은 가장 이상적인 상태에서는 즐거운 놀이와도 같아야 합니다. 그리고 초기 생성적 AI의 조명은 나에게 그 "놀이 같은 창작 경험"이 더 많은 창작 형태로 확장될 수 있을 것이라 믿게 했습니다. 나는 생산적 AI가 어떻게 전자 게임을 재구성할지 상상하기 시작했습니다(2018년에 Myst 화면을 기반으로 사이클GAN으로 훈련한 그 비디오를 생각하며).


지금까지 8년이 흘렀고, 이제 우리는 단 하나의 힌트로 비디오, 게임 또는 음악을 생성할 수 있습니다. 상상했던 미래가 드디어 왔다는 것을 깨달았습니다 — 하지만 이것은 단지 시작일 뿐입니다.


돌아보면 나는 왜 이 정도 초기에 이러한 강한 믿음을 갖게 되었을까 싶기도 합니다. 아마도 그것은 내 삶이 항상 기술과 예술의 교차로에 있었기 때문일 것입니다: 한쪽은 수학과 딥 러닝의 백그라운드, 반면에 댄스와 음악의 예술적 열정이었습니다. 생성적 AI의 창업은 두 가지를 모두 갖추어야 했습니다: 기술적 배경으로 미래를 보고, 예술적 성향으로 그것을 구현하고 싶었기 때문입니다.


창업 여정은 상상 이상으로 더 길고 힘들었습니다. 가장 비합리적으로 믿을 수밖에 없는 것을 찾아야만 이를 최대한 유지할 수 있게 될 것입니다.



2017년의 CycleGAN, 우리는 멀리 왔습니다.

2018년—2023년: 사용자를 감동시키는 "그럭저럭 쓸 만한" 제품



제 3 버전 iOS 애플리케이션 Tokkingheads의 인터페이스 스크린샷입니다. 초기 생성식 AI의 핵심은 간결한 프로세스를 설계하고 제품의 초안적 느낌을 적극적으로 수용하는 것이었습니다.


우리는 이 과정을 통해 다양한 제품을 출시했습니다. 이는 최첨단 모델 능력에 대한 직관을 향상시키고 초기 결함을 감추는 마법같은 경험으로 포장하는 방법을 배우기 위한 목적이었습니다. 그 단계에서 저는 이해했습니다: 모델 출력이 완벽하게 이루어지지 않았을 때라도 사용자가 빠르게 반복하고 빠른 피드백을 제공할 수 있는 대중적 경험을 설계할 수 있습니다. 사용자들은 깐깐하지만 취약하지 않습니다. 사용하기 편하게 만드는 것으로도 충분합니다.


제 3번 모바일 애플리케이션으로 도달했을 때, 우리는 충분한 인식을 쌓았습니다. 이를 통해 Tokkingheads가 자연스럽게 성장하면서 바이럴한 전파를 실현시켰고, 몇 주 만에 사용자가 2백만 명을 넘었습니다. 그 다음 중요한 교훈이 도래했습니다: 창업자로서, 지속적인 동기부여를 위한 어떤 제품 형태를 원하는지 명확히 이해해야 합니다. Tokkingheads는 대대적인 인기로 나아갈 수 있었지만, 그것이 이 창작 마법을 더 완전한 제품으로 발전시키는 올바른 농토인지 확신하지 못했습니다. 그 더 완전한 제품이 제 진정한 원망인 것 같았습니다.


그래서 우리는 계속 발전했습니다. AI 생성된 이미지 라이브러리, NFT를 지원하는 AI 아트 (네, 작품 품질이 중요하다고 순진하게 생각했지만, 실제 중요한 기술은 형평성 거래였습니다), 그리고 AI 게임 소재 생성 도구를 만들었습니다. 각 제품은 사용자들이 왜 지불하려고 하는지, 모델이 얼마나 빠른 속도로 발전하는지에 대한 구체적인 교훈을 제공했습니다. 이러한 프로젝트 사이에는 세계적인 대유행과 실리콘 밸리은행과 제1공화은행의 손실 맥락 등이 있었으며, 이것들은 저에게 감사함을 느끼도록 도왔습니다. 계속해서 무언가를 구축할 수 있다는 것 자체가 특권임을 알게 되었습니다.


2023 년: 코드 생성의 성숙 단계


드디어 코드 생성이 충분히 성숙해져 사용 시기가 도래했으며, 비기술적 창작자를 위한 게임 도구를 구축할 수 있었습니다. GPT-4가 출시된 후, 그 미래가 구체적으로 느껴졌습니다. 2023년 3월, 저는 팀과 함께 메모를 공유하고 아래의 프로토타입으로 Rosebud 텍스트-투-게임 기능의 초기 버전을 제시했습니다.



2023 년 3월 23일 트윗 스크린샷입니다. 저는 GPT-4를 사용하여 Three.js를 학습하고, Rosebud 생성식 AI를 결합하여 하늘 상자를 생성했으며, 텍스트를 통해 3D 장면을 소환하는 초기 프로토타입을 시연했습니다.



2023 년 초, 팀에게 보낸 내부 메모는 코드 생성 능력의 전환 후 제품 판단을 기록했습니다. 이 내부 편지의 핵심 판단은 다음과 같습니다: AI는 미래 몇십 년을 결정할 중요한 창을 지나고 있으며, 다가올 두 년은 매우 격렬한 경쟁 단계가 되어, 리듬이 빠르고 강도가 높으며 명확한 제거가 될 것입니다. 회사는 이 "질주"에 온 힘을 기울일 것이며, 강력한 내부 동기부여를 가진 사람들과 그 부담을 지고 장기적으로 투자할 의지를 가진 사람들만 참여해야 합니다. 왜냐하면 이것은 단순히 일자리 경험이 아니라, 개인 경력 궤적을 바꿀 수 있는 역사적인 기회이기 때문입니다.


2026년 이후: 실험실이 원하지 않는 것들을 만들 수 있나요?



이미지: 데모 비디오 - 저자가 브라우저에서 힌트 단어를 사용하여 3D 도시 시뮬레이션 게임을 구축하는 것을 보여줌


게임을 만들려면 창의적 직관과 기술 능력을 동시에 활용해야 합니다. 생성주의 AI는 게임 제작 자체를 놀이로 만드는 핵심 요소입니다. 이미지, 비디오, 월드 모델 또는 코드 측면의 어떤 모델 발전이든 즉시 흡수되어 변환될 것입니다. 게임의 비즈니스 모델은 대부분 전선 실험실이 시야에서 배제될 가능성이 가장 높습니다: 핵심 수익 경로는 여전히 플레이어 결제이며, AGI로의 급속 전진을 향한 실험실에는 플레이어 측 유통 체계를 구축하는 것은 너무 간접적인 부수적 작업으로 보일 수 있습니다. 창립자에게는 무엇을 구축할지 선택하는 것이 항상 실험실의 핵심 경로 이외의 공간을 찾아야 하는 지속적인 게임입니다.


Rosebud는 성장세를 유지하고 있습니다. 우리는 규모가 크고 매우 활발한 크리에이터 커뮤니티를 유기적으로 축적했습니다. 나는 디스코드에서 크리에이터들과의 소소한 대화와 매일 사용자 지원 이메일을 처리하는 날들을 그리워할 것입니다(불평을 간절히 하는 사용자는 제품을 정말로 소중히 여기는 것입니다). 다음 단계의 핵심은 플레이어 측 분산 규모를 확대하는 것이므로, 이제가 바로 나란히 싸워온 동료에게 지팡이를 넘기는 좋은 시점입니다.


@glazworks님을 Rosebud의 새 CEO로 축하합니다! 그는 머신 러닝 재능과 제품 감각을 두루 갖춘 흔치 않은 인물입니다.


Martin Casado와 a16z 팀은 Rosebud의 성장을 전 과정 동행했습니다. 저와 Martin은 Rosebud 게임에 대한 올바른 기술 스택이 JavaScript인지에 대한 중요한 대화를 나눴습니다 - Unity나 Roblox를 선택하는 것이 더 인기가 있을 수 있지만, JavaScript의 코드 생성 개선 속도가 훨씬 빠르기 때문에 더 많은 훈련 데이터에 액세스할 수 있습니다. 이 팀은 진실을 추구하며 더 많은 건설자들을 모으는 것에 베팅하는 것을 감수합니다. 이것이 이상적인 미래로 나아가는 길입니다: 우리는 건설해야 하며, 혁신해 나가야 합니다.


다른 쪽 테이블에서 여러분과 계속해서 협력할 수 있기를 기대합니다. 언제든지 개인 메시지 환영합니다.


[원문 링크]



BlockBeats 공식 커뮤니티에 참여하세요:

Telegram 구독 그룹:https://t.me/theblockbeats

Telegram 토론 그룹:https://t.me/BlockBeats_App

Twitter 공식 계정:https://twitter.com/BlockBeatsAsia

举报 오류 신고/제보
문고 선택
새 문고 추가
취소
완료
새 문고 추가
자신만 보기
공개
저장
오류 신고/제보
제출