Building AI Products Between Uber Rides: My Delusional Developer Diary
It's past midnight and I'm sitting in my Honda Civic outside a bubble tea shop on Commercial Drive, watching my laptop battery slowly die while I debug the most embarrassing API integration failure of my life. The drunk university students I dropped off five minutes ago paid cash and stumbled toward what I assume was their dorm, leaving me alone with my thoughts and a codebase that's more spaghetti than software. This is my life now: Vancouver Uber driver by night, wannabe AI entrepreneur during surge pricing lulls.
Six months ago, I had zero AI experience and a Computer Science degree I wasn't using. Now I've got three half-finished AI products, a GitHub full of abandoned repositories, and enough rejection emails from investors to wallpaper my studio apartment in Burnaby. But I'm still here, still building, still convincing myself that the next deployment will be the one that changes everything.
The Reality Check Nobody Talks About
Everyone on Twitter makes indie AI development look glamorous. Post a screenshot of your revenue dashboard, share some inspirational quote about building in public, watch the likes roll in. The reality is uglier. I'm building products in Tim Hortons parking lots at 3 AM because that's when the tourists stop requesting rides and I actually have time to code.
My current setup is pathetic: 2019 MacBook Pro with a cracked screen, phone hotspot for internet that cuts out every time a bus drives by, and a car seat that wasn't designed for humans to spend eight hours debugging Python scripts. My back is permanently twisted from hunching over my laptop in cramped spaces, and I've memorized every 24-hour coffee shop between downtown and Richmond because they're the only places with reliable WiFi and bathrooms.
The AI development ecosystem is moving so fast that any tutorial I bookmark is obsolete before I finish reading it. OpenAI releases a new model, Anthropic updates their API, Google announces something that makes everything I'm working on potentially irrelevant. I'm constantly rebuilding the same features because the underlying technology shifted while I was driving drunk people home from Granville Street.
Product One: The Language Learning Disaster
My first AI product was going to revolutionize language learning for immigrants in Vancouver. Because nothing says "understanding your market" like a guy who only speaks English building language tools for people learning English, right?
The concept seemed solid: an AI tutor that helped newcomers practice English using Vancouver-specific scenarios. Order coffee at JJ Bean, ask for directions to VCC, navigate a conversation with a landlord about BC Hydro bills. Real situations they'd actually encounter, powered by GPT-4 with custom prompts that understood local context.
I spent three weeks building this thing between rides. Parked outside YVR waiting for airport runs, coding conversation flows. Sitting in the McDonald's on Robson at 2 AM, training the AI on Vancouver slang and local references. The app could generate realistic dialogues about anything from SkyTrain delays to explaining the difference between Vancouver and North Vancouver to confused tourists.
The technical implementation was a mess. I'm talking about state management held together by prayer, a database schema that made sense at 4 AM but looked like abstract art during daylight debugging sessions. The AI responses were inconsistent — sometimes brilliant, sometimes recommending that users practice English by asking strangers about "the beautiful mountains of Regina" or suggesting they take the "Toronto subway to Stanley Park."
Launch day came. I posted on Reddit, shared in some Facebook groups for newcomers, even convinced a few passengers to try it out. The feedback was... educational. Turns out people learning English don't want to practice with an AI that occasionally forgets which city it's supposed to be helping them navigate. One user left a review that still haunts me: "App told me to practice ordering 'Vancouver-style pizza.' I asked at three places. No one knows what that means. Neither does the app."
Total users after two months: minimal adoption. Lessons learned: Maybe understand your target market before building solutions for them.
Pivoting in a Parking Lot
Product failure is different when you're building between Uber rides. There's no team meeting to discuss next steps, no whiteboard session to brainstorm pivots. Just me, sitting outside Cactus Club at 1 AM, staring at Google Analytics showing zero active users, trying to figure out what went wrong while monitoring for ride requests.
The pivot came during a particularly slow Tuesday night. I was parked outside a hotel downtown, watching my language learning app's engagement metrics flatline, when I overheard two passengers talking about how impossible it was to find good content creators for their startup's blog. They needed technical content, they needed it fast, and they were willing to pay well for quality writing.
Lightbulb moment: What if I built an AI writing assistant specifically for technical content? Not another generic AI writing tool, but something purpose-built for SaaS companies, startups, developers — people who needed content that didn't sound like it was written by a robot trying to hit SEO keyword targets.
I started building that night. New GitHub repo, new product vision, same cracked laptop screen and terrible posture. This time I was smarter about the architecture — or at least I thought I was. Cleaner API design, better database structure, more thoughtful prompt engineering. The AI could write technical blog posts, API documentation, product descriptions, even code comments that didn't sound like they were generated by a particularly verbose random number generator.
The Technical Nightmare Nobody Warns You About
Building AI products as a solo developer is like being a one-person orchestra where half the instruments are on fire and the sheet music keeps changing mid-performance. Every integration breaks differently. Every API has its own special way of failing catastrophically.
OpenAI's API would randomly start returning responses in what I think was Portuguese, but only for certain prompt types, only on Tuesdays, only when Mercury was in retrograde. Anthropic's Claude would work perfectly for weeks, then suddenly develop strong opinions about not writing marketing copy because it might be "manipulative." I spent more time managing API quirks than building actual features.
Vector databases are the special hell reserved for indie developers who thought storing embeddings would be straightforward. Pinecone worked great until it didn't. Weaviate had beautiful documentation that bore no resemblance to how anything actually functioned. I tried building my own vector storage solution and learned why that's a bad idea around the same time my laptop started making concerning noises during indexing operations.
The infrastructure costs were eating me alive. Every experiment, every test, every time I forgot to add proper rate limiting — money flying out of my AWS account faster than I could earn it driving around Vancouver's late-night crowd. I optimized everything I could think of: smaller models for simple tasks, response caching, aggressive prompt engineering to reduce token usage. Still burning through money on compute costs while my actual revenue remained stubbornly at zero.
Finding Users in Unexpected Places
Marketing an AI product from your car is surreal. I'm posting screenshots to Twitter while waiting at red lights, responding to Hacker News comments between passenger pickups, trying to build an audience of potential customers while my primary job involves driving people around who have no idea I'm moonlighting as a tech entrepreneur.
The breakthrough came from an unexpected source: my Uber passengers. I started mentioning my AI writing tool to anyone who looked like they worked in tech. Vancouver's startup scene is surprisingly small, and apparently everyone knows everyone else. A data scientist I drove from a downtown coworking space to YVR tried my tool and loved it. She introduced me to her startup's marketing team. They became my first paying customers.
Word spread organically through Vancouver's tech community. Coffee shop conversations, networking events I couldn't attend because I was driving, Slack groups where my early users shared my tool with their colleagues. I wasn't scaling through traditional marketing channels — I was growing through the weird intersection of ride-sharing and tech networking that only exists in cities like Vancouver where everyone's connected by about two degrees of separation.
Revenue started trickling in: modest amounts the first month, growing consistently in subsequent months. Not life-changing money, but enough to cover my AWS bills and buy better coffee for those 3 AM debugging sessions. More importantly, people were actually using what I'd built. The AI was generating content that real companies were publishing, content that didn't sound like it came from a content mill or keyword-stuffing factory.
The Validation Trap
Success is dangerous when you're building solo. That first taste of revenue, those initial positive user reviews, the satisfaction of seeing your code actually solve real problems — it's intoxicating. I started thinking I'd figured it out, that I'd cracked the code on AI product development while sitting in my Honda Civic.
I got cocky. Started planning Product Three before I'd properly scaled Product Two. Began sketching out some ambitious AI-powered content management system that would revolutionize how small businesses handled their entire content pipeline. The scope creep was real and it was spectacular.
Meanwhile, my existing users were asking for basic features I hadn't built: better content organization, collaboration tools, integrations with platforms they actually used. Instead of listening, I was chasing the next shiny AI capability, trying to build something technically impressive rather than something genuinely useful.
The wake-up call came during a particularly honest conversation with my biggest customer, a startup that was paying me meaningfully for their content generation. They loved the AI's output quality, but the tool itself was clunky and missing obvious features. They were copying content into Google Docs to share with their team, manually tracking what they'd generated, keeping spreadsheets of content ideas because my product didn't handle any of that workflow.
Building What People Actually Want
That feedback session changed everything. I stopped working on the grand vision and started fixing the boring problems my actual users were dealing with every day. Better file organization, team collaboration, content calendars, usage analytics that made sense. Not sexy features, not AI breakthroughs, just solid product development that made people's lives marginally easier.
The technical work was less interesting but more important. Building proper user authentication, implementing file sharing, creating dashboard views that loaded in under three seconds. I spent more time optimizing database queries than training AI models, more time on UX improvements than prompt engineering breakthroughs.
Revenue grew consistently month over month. Still not enough to quit Uber, but enough to start thinking about what that transition might look like. My users were sticking around, upgrading to higher tiers, referring colleagues. The product was becoming genuinely useful rather than just technically clever.
The Long Road Ahead
I'm still driving Uber, still building AI products between rides, still debugging deployment issues in parking lots across Vancouver. But something has changed. This isn't just a side hustle anymore — it's becoming a real business, slowly and messily and in ways I never expected.
The AI ecosystem is still moving faster than I can keep up with. New models, new capabilities, new competitors launching every week. But I'm starting to understand that success isn't about having the most advanced AI or the most innovative features. It's about solving real problems for real people, consistently and reliably, even if your development environment is the front seat of a 2018 Honda Civic.
There's still a long way to go. Revenue needs to grow substantially before I can stop driving nights. The product roadmap is full of features that seem obvious in retrospect but require weeks of development time I'm stealing from sleep and social life. Competition is increasing, and VC-funded startups are building similar tools with teams of experienced developers and marketing budgets that dwarf my annual income.
But I'm still here, still building, still convinced that bootstrapping an AI company from your car is somehow a viable career path. Maybe I'm delusional. Maybe this whole experiment will flame out spectacularly and I'll be driving Uber for the next five years. Or maybe, just maybe, I'll figure out how to turn late-night coding sessions and customer conversations into something that resembles a real business. Either way, I'll be documenting every mistake, every small victory, every moment of questioning whether any of this makes sense. Because if there's one thing I've learned building AI products between Uber rides, it's that the journey is stranger and more educational than any outcome I could have planned.
بناء منتجات الذكاء الاصطناعي بين رحلات أوبر: يوميات مطور واهم
لقد تجاوزت منتصف الليل وأنا جالس في سيارتي هوندا سيفيك خارج محل شاي بوبلز في شارع كوميرشال درايف، أشاهد بطارية لابتوبي تموت ببطء بينما أُصحح أخطر فشل في تكامل واجهة برمجة التطبيقات (API) في حياتي. طلاب الجامعة المخمورون الذين أوصلتهم قبل خمس دقائق دفعوا نقداً وتهادوا نحو ما أفترض أنه مسكنهم، تاركينني وحدي مع أفكاري وقاعدة بيانات برمجية أشبه بالشعرية المطبوخة منها بالبرمجيات. هذه هي حياتي الآن: سائق أوبر في فانكوفر ليلاً، ورائد أعمال ذكاء اصطناعي وهمي خلال فترات انخفاض الطلب.
قبل ستة أشهر، لم تكن لدي أي خبرة في الذكاء الاصطناعي وكان لدي شهادة في علوم الحاسوب لم أكن أستخدمها. الآن لدي ثلاثة منتجات ذكاء اصطناعي نصف مكتملة، وحساب GitHub مليء بالمستودعات المهجورة، وعدد كافٍ من رسائل الرفض من المستثمرين لتغطية جدران شقتي الصغيرة في بورنابي. لكنني ما زلت هنا، ما زلت أُطور، وما زلت أُقنع نفسي بأن النشر التالي سيكون هو الذي سيغير كل شيء.
الواقع القاسي الذي لا يتحدث عنه أحد
الجميع على تويتر يجعلون تطوير الذكاء الاصطناعي المستقل يبدو ساحراً. انشر لقطة شاشة للوحة إيراداتك، شارك اقتباساً تحفيزياً عن البناء علناً، وشاهد الإعجابات تتوالى. الواقع أكثر قبحاً. أنا أبني منتجات في مواقف سيارات تيم هورتونز في الساعة 3 صباحاً لأنه في ذلك الوقت يتوقف السياح عن طلب الرحلات ويكون لدي وقت فعلي للبرمجة.
إعدادي الحالي مثير للشفقة: لابتوب MacBook Pro موديل 2019 بشاشة مكسورة، ونقطة اتصال هاتفية للإنترنت تنقطع كلما مرت حافلة بجانبي، ومقعد سيارة لم يُصمم ليجلس عليه البشر لثماني ساعات لتصحيح نصوص بايثون (Python). ظهري ملتوي بشكل دائم من الانحناء على لابتوبي في مساحات ضيقة، وقد حفظت عن ظهر قلب كل مقهى يفتح 24 ساعة بين وسط المدينة وريتشموند لأنها الأماكن الوحيدة التي توفر شبكة WiFi موثوقة وحمامات.
النظام البيئي لتطوير الذكاء الاصطناعي يتحرك بسرعة كبيرة لدرجة أن أي برنامج تعليمي أضع إشارة مرجعية عليه يصبح قديماً قبل أن أنهي قراءته. OpenAI تطلق نموذجاً جديداً، Anthropic تُحدّث واجهة برمجة التطبيقات (API) الخاصة بها، Google تعلن عن شيء يجعله كل ما أعمل عليه قد يصبح عديم الجدوى. أعيد بناء الميزات نفسها باستمرار لأن التكنولوجيا الأساسية تغيرت بينما كنت أوصل السكارى إلى منازلهم من شارع غرانفيل.
المنتج الأول: كارثة تعلم اللغة
كان من المفترض أن يُحدث أول منتج لي في الذكاء الاصطناعي ثورة في تعلم اللغة للمهاجرين في فانكوفر. لأنه لا شيء يقول "فهم السوق" مثل رجل يتحدث الإنجليزية فقط ويبني أدوات لغوية لأشخاص يتعلمون الإنجليزية، أليس كذلك؟
بدت الفكرة صلبة: مدرس ذكاء اصطناعي يساعد الوافدين الجدد على ممارسة الإنجليزية باستخدام سيناريوهات خاصة بفانكوفر. اطلب قهوة من JJ Bean، اسأل عن الاتجاهات إلى VCC، تجر محادثة مع مالك عقار حول فواتير BC Hydro. مواقف حقيقية سيواجهونها فعلاً، مدعومة بـ GPT-4 مع تعليمات مخصصة تفهم السياق المحلي.
قضيت ثلاثة أسابيع في بناء هذا الشيء بين الرحلات. متوقفاً خارج YVR في انتظار رحلات المطار، أبرمج تدفقات المحادثة. جالساً في مطعم ماكدونالدز في شارع روبسون في الساعة 2 صباحاً، أدرب الذكاء الاصطناعي على العامية الفانكوفرية والمراجع المحلية. كان التطبيق قادراً على توليد حوارات واقعية عن أي شيء من تأخيرات سكاي ترين إلى شرح الفرق بين فانكوفر وشمال فانكوفر للسياح الحائرين.
التنفيذ التقني كان كارثة. أنا أتحدث عن إدارة الحالة المتماسكة بالدعاء، ومخطط قاعدة بيانات كان منطقياً في الساعة 4 صباحاً لكنه بدا كفن تجريدي أثناء جلسات التصحيح النهاري. ردود الذكاء الاصطناعي كانت غير متناسقة — أحياناً رائعة، وأحياناً توصي المستخدمين بممارسة الإنجليزية بسؤال الغرباء عن "جبال ريجينا الجميلة" أو تقترح عليهم ركوب "مترو تورنتو إلى ستانلي بارك".
جاء يوم الإطلاق. نشرت على Reddit، شاركت في بعض مجموعات فيسبوك للوافدين الجدد، بل وأقنعت بعض الركاب بتجربته. كانت الملاحظات... تعليمية. اتضح أن الأشخاص الذين يتعلمون الإنجليزية لا يريدون الممارسة مع ذكاء اصطناعي ينسى أحياناً أي مدينة من المفترض أن يساعدهم في التنقل فيها. ترك أحد المستخدمين مراجعة لا تزال تطاردني: "طلب مني التطبيق أن أتدرب على طلب 'البيتزا على طريقة فانكوفر'. سألت في ثلاثة أماكن. لا أحد يعرف ما يعنيه ذلك. ولا التطبيق."
إجمالي المستخدمين بعد شهرين: اعتماد ضئيل. الدروس المستفادة: ربما افهم السوق المستهدف قبل بناء حلول له.
تغيير الاتجاه في موقف سيارات
فشل المنتج يبدو مختلفاً عندما تبني بين رحلات أوبر. لا يوجد اجتماع فريق لمناقشة الخطوات التالية، ولا جلسة عصف ذهني لتبادل الأفكار. فقط أنا، جالساً خارج Cactus Club في الساعة 1 صباحاً، أحدق في Google Analytics الذي يظهر صفر مستخدم نشط، محاولاً فهم الخطأ الذي حدث بينما أراقب طلبات الرحلات.
جاء تغيير الاتجاه خلال ليلة ثلاثاء بطيئة بشكل خاص. كنت متوقفاً خارج فندق في وسط المدينة، أشاهد مقاييس التفاعل في تطبيق تعلم اللغة الخاص بي وهي تتسطح، عندما سمعت راكبين يتحدثان عن مدى استحالة العثور على منتجي محتوى جيدين لمدونة شركتهم الناشئة. كانا بحاجة إلى محتوى تقني، يحتاجانه بسرعة، وكانا على استعداد لدفع مبلغ جيد مقابل كتابة ذات جودة.
لحظة الإلهام: ماذا لو بنيت مساعد كتابة بالذكاء الاصطناعي مخصص للمحتوى التقني؟ ليس أداة كتابة ذكاء اصطناعي عامة أخرى، بل شيء مبني خصيصاً لشركات SaaS، والشركات الناشئة، والمطورين — الأشخاص الذين يحتاجون محتوى لا يبدو وكأنه كتبه روبوت يحاول تحقيق أهداف كلمات SEO الرئيسية.
بدأت البناء تلك الليلة. مستودع GitHub جديد، رؤية منتج جديدة، نفس شاشة اللابتوب المكسورة والوضعية السيئة. هذه المرة كنت أكثر ذكاءً فيما يتعلق بالهندسة المعمارية — أو على الأقل اعتقدت ذلك. تصميم API أنظف، هيكل قاعدة بيانات أفضل، هندسة تعليمات أكثر تفكيراً. يمكن للذكاء الاصطناعي كتابة منشورات مدونة تقنية، وثائق API، أوصاف منتجات، وحتى تعليقات برمجية لا تبدو وكأنها مولدة بواسطة مولد أرقام عشوائية ثرثار بشكل خاص.
الكابوس التقني الذي لا يحذرك منه أحد
بناء منتجات الذكاء الاصطناعي كمطور منفرد يشبه كونك أوركسترا من شخص واحد حيث نصف الآلات مشتعلة والنوتة الموسيقية تتغير باستمرار في منتصف الأداء. كل تكامل ينكسر بشكل مختلف. كل API له طريقته الخاصة في الفشل الكارثي.
واجهة برمجة التطبيقات (API) الخاصة بـ OpenAI كانت تعيد بشكل عشوائي ردوداً فيما أعتقد أنها البرتغالية، ولكن فقط لأنواع معينة من التعليمات، فقط أيام الثلاثاء، فقط عندما يكون عطارد في حالة تراجع. Claude من Anthropic كان يعمل بشكل مثالي لأسابيع، ثم فجأة يطور آراء قوية حول عدم كتابة مواد تسويقية لأنها قد تكون "متلاعبة". أمضيت وقتاً في إدارة تقلبات API أكثر من بناء الميزات الفعلية.
قواعد البيانات المتجهة (Vector databases) هي الجحيم الخاص المحجوز للمطورين المستقلين الذين اعتقدوا أن تخزين التضمينات (embeddings) سيكون سهلاً. عملت Pinecone بشكل رائع حتى توقفت. كان لدى Weaviate وثائق جميلة لا تشبه كيف يعمل أي شيء فعلياً. حاولت بناء حل تخزين متجه خاص بي وتعلمت لماذا هذه فكرة سيئة في نفس الوقت تقريباً الذي بدأ فيه لابتوبي يصدر أصواتاً مقلقة أثناء عمليات الفهرسة.
تكاليف البنية التحتية كانت تأكلني حياً. كل تجربة، كل اختبار، كل مرة نسيت فيها إضافة تحديد مناسب للمعدل — أموال تخرج من حساب AWS الخاص بي أسرع مما يمكنني كسبه بقيادة الحشود الليلية في فانكوفر. قمت بتحسين كل ما يمكنني التفكير فيه: نماذج أصغر للمهام البسيطة، تخزين مؤقت للاستجابات، هندسة تعليمات قوية لتقليل استخدام الرموز المميزة. ما زلت أحرق المال على تكاليف الحوسبة بينما ظلت إيراداتي الفعلية عند الصفر بعناد.
العثور على مستخدمين في أماكن غير متوقعة
تسويق منتج ذكاء اصطناعي من سيارتك أمر سريالي. أنا أنشر لقطات شاشة على تويتر أثناء انتظار الإشارات الحمراء، أرد على تعليقات Hacker News بين رحلات الركاب، أحاول بناء جمهور من العملاء المحتملين بينما وظيفتي الأساسية تتضمن نقل أشخاص ليس لديهم أي فكرة أنني أعمل بدوام إضافي كرائد أعمال تقني.
جاء الاختراق من مصدر غير متوقع: ركاب أوبر الخاصين بي. بدأت أذكر أداة الكتابة بالذكاء الاصطناعي الخاصة بي لأي شخص يبدو أنه يعمل في مجال التكنولوجيا. مشهد الشركات الناشئة في فانكوفر صغير بشكل مفاجئ، ويبدو أن الجميع يعرفون بعضهم البعض. عالمة بيانات أقلتها من مساحة عمل مشتركة في وسط المدينة إلى YVR جربت أداتي وأحبّتها. قدمتني لفريق التسويق في شركتها الناشئة. أصبحوا أول عملائي الذين يدفعون.
انتشرت الكلمة عضوياً عبر مجتمع التكنولوجيا في فانكوفر. محادثات في المقاهي، فعاليات تواصل لم أتمكن من حضورها لأنني كنت أقود، مجموعات Slack حيث شارك مستخدمي الأوائل أداتي مع زملائهم. لم أكن أتوسع عبر قنوات التسويق التقليدية — كنت أنمو عبر التقاطع الغريب بين مشاركة الركوب والتواصل التكنولوجي الموجود فقط في مدن مثل فانكوفر حيث الجميع متصلون بدرجتين من الانفصال تقريباً.
بدأت الإيرادات تتدفق ببطء: مبالغ متواضعة في الشهر الأول، وتنمو بثبات في الأشهر التالية. ليست أموالاً تغير الحياة، لكنها كافية لتغطية فواتير AWS الخاصة بي وشراء قهوة أفضل لجلسات التصحيح في الساعة 3 صباحاً. والأهم من ذلك، أن الناس كانوا يستخدمون فعلاً ما بنيته. كان الذكاء الاصطناعي يولد محتوى تنشره شركات حقيقية، محتوى لا يبدو وكأنه جاء من مطحنة محتوى أو مصنع حشو كلمات مفتاحية.
فخ التحقق من الصحة
النجاح خطير عندما تبني بمفردك. تلك المذاق الأول للإيرادات، تلك المراجعات الإيجابية الأولى من المستخدمين، الرضا عن رؤية الكود الخاص بك يحل مشاكل حقيقية — إنه مسكر. بدأت أعتقد أنني توصلت إلى الحل، أنني فكت شفرة تطوير منتجات الذكاء الاصطناعي وأنا جالس في هوندا سيفيك الخاصة بي.
أصبحت مغروراً. بدأت التخطيط للمنتج الثالث قبل أن أوسع المنتج الثاني بشكل صحيح. بدأت برسم نظام إدارة محتوى طموح يعمل بالذكاء الاصطناعي من شأنه أن يحدث ثورة في كيفية إدارة الشركات الصغيرة لخط أنابيب المحتوى بأكمله. زحف النطاق كان حقيقياً وكان مذهلاً.
في هذه الأثناء، كان المستخدمون الحاليون يطلبون ميزات أساسية لم أبنها: تنظيم محتوى أفضل، أدوات تعاون، تكاملات مع المنصات التي يستخدمونها فعلاً. بدلاً من الاستماع، كنت أطارد القدرة اللامعة التالية للذكاء الاصطناعي، محاولاً بناء شيء مثير للإعجاب تقنياً بدلاً من شيء مفيد حقاً.
جاءت صحوة الضمير خلال محادثة صريحة بشكل خاص مع أكبر عميل لي، شركة ناشئة كانت تدفع لي مبلغاً جيداً مقابل توليد المحتوى. كانوا يحبون جودة مخرجات الذكاء الاصطناعي، لكن الأداة نفسها كانت غير متقنة وتفتقر إلى ميزات واضحة. كانوا ينسخون المحتوى إلى Google Docs لمشاركته مع فريقهم، ويتتبعون يدوياً ما قاموا بتوليده، ويحتفظون بجداول بيانات لأفكار المحتوى لأن منتجي لم يتعامل مع أي من سير العمل ذلك.
بناء ما يريده الناس فعلاً
تلك الجلسة التغذوية الراجعة غيرت كل شيء. توقفت عن العمل على الرؤية الكبرى وبدأت في إصلاح المشاكل المملة التي كان يتعامل معها مستخدمي الفعليين يومياً. تنظيم ملفات أفضل، تعاون جماعي، تقويمات محتوى، تحليلات استخدام منطقية. ليست ميزات مثيرة، ليست اختراقات في الذكاء الاصطناعي، مجرد تطوير منتج متين يجعل حياة الناس أسهل قليلاً.
كان العمل التقني أقل إثارة للاهتمام ولكنه أكثر أهمية. بناء مصادقة مستخدمين مناسبة، تنفيذ مشاركة الملفات، إنشاء لوحات تحكم تُحمّل في أقل من ثلاث ثوان. أمضيت وقتاً أطول في تحسين استعلامات قاعدة البيانات من تدريب نماذج الذكاء الاصطناعي، ووقتاً أطول في تحسينات تجربة المستخدم من اختراقات هندسة التعليمات.
نمت الإيرادات باستمرار شهراً بعد شهر. لا تزال غير كافية لترك أوبر، لكنها كافية للبدء في التفكير في كيف قد يبدو هذا الانتقال. كان مستخدمي يظلون معي، يرقون إلى مستويات أعلى، ويحيلون الزملاء. أصبح المنتج مفيداً حقاً بدلاً من أن يكون ذكياً تقنياً فقط.
الطريق الطويل أمامنا
ما زلت أقود لأوبر، ما زلت أبني منتجات الذكاء الاصطناعي بين الرحلات، ما زلت أصحح مشاكل النشر في مواقف السيارات في جميع أنحاء فانكوفر. لكن شيئاً ما تغير. هذا لم يعد مجرد عمل جانبي — إنه يتحول إلى عمل حقيقي، ببطء وبشكل فوضوي وبطرق لم أتوقعها أبداً.
النظام البيئي للذكاء الاصطناعي لا يزال يتحرك أسرع مما يمكنني مواكبته. نماذج جديدة، قدرات جديدة، منافسون جدد ينطلقون كل أسبوع. لكنني بدأت أفهم أن النجاح لا يتعلق بامتلاك الذكاء الاصطناعي الأكثر تقدماً أو الميزات الأكثر ابتكاراً. إنه يتعلق بحل مشاكل حقيقية لأناس حقيقيين، باستمرار وبموثوقية، حتى لو كانت بيئة التطوير الخاصة بك هي المقعد الأمامي لهوندا سيفيك موديل 2018.
لا يزال هناك طريق طويل لنقطعه. تحتاج الإيرادات إلى النمو بشكل كبير قبل أن أتمكن من التوقف عن القيادة ليلاً. خارطة طريق المنتج مليئة بالميزات التي تبدو واضحة بأثر رجعي ولكنها تتطلب أسابيع من وقت التطوير أسرقه من النوم والحياة الاجتماعية. المنافسة تتزايد، والشركات الناشئة الممولة برأس المال الاستثماري تبني أدوات مماثلة مع فرق من المطورين ذوي الخبرة وميزانيات تسويق تفوق دخلي السنوي.
لكنني ما زلت هنا، ما زلت أبني، ما زلت مقتنعاً بأن بناء شركة ذكاء اصطناعي من سيارتك هو بطريقة ما مسار وظيفي قابل للحياة. ربما أنا واهم. ربما هذه التجربة بأكملها ستنتهي بشكل مذهل وسأقود لأوبر للسنوات الخمس القادمة. أو ربما، فقط ربما، سأكتشف كيفية تحويل جلسات البرمجة في وقت متأخر من الليل ومحادثات العملاء إلى شيء يشبه عملاً حقيقياً. على أي حال، سأوثق كل خطأ، وكل انتصار صغير، وكل لحظة تساؤل عما إذا كان أي من هذا منطقياً. لأنه إذا كان هناك شيء واحد تعلمته من بناء منتجات الذكاء الاصطناعي بين رحلات أوبر، فهو أن الرحلة أغرب وأكثر تعليماً من أي نتيجة كنت لأخطط لها.
KI-Produkte zwischen Uber-Fahrten entwickeln: Mein verrücktes Entwicklertagebuch
Es ist nach Mitternacht, und ich sitze in meinem Honda Civic vor einem Bubble-Tea-Laden an der Commercial Drive und sehe zu, wie der Akku meines Laptops langsam stirbt, während ich den peinlichsten API-Integrationsfehler meines Lebens behebe. Die betrunkenen Studenten, die ich vor fünf Minuten abgesetzt habe, haben bar bezahlt und sind in Richtung ihres – vermutlichen – Wohnheims getaumelt und mich mit meinen Gedanken und einer Codebasis zurückgelassen, die eher Spaghetti als Software ist. Das ist jetzt mein Leben: Vancouver Uber-Fahrer bei Nacht, angehender KI-Unternehmer in den Flautezeiten der Nachfrage.
Vor sechs Monaten hatte ich null KI-Erfahrung und einen Informatik-Abschluss, den ich nicht nutzte. Jetzt habe ich drei halbfertige KI-Produkte, ein GitHub voller verlassener Repositorys und genug Ablehnungsmails von Investoren, um damit mein Studio-Apartment in Burnaby zu tapezieren. Aber ich bin immer noch hier, baue immer noch auf und rede mir immer noch ein, dass der nächste Deployment derjenige sein wird, der alles verändert.
Der Realitätscheck, über den niemand spricht
Jeder auf Twitter lässt die Entwicklung von KI-Produkten durch Einzelkämpfer glamourös aussehen. Poste einen Screenshot deines Umsatz-Dashboards, teile ein inspirierendes Zitat über öffentliches Entwickeln, und warte auf die Likes. Die Realität ist hässlicher. Ich entwickle Produkte um 3 Uhr morgens auf Parkplätzen von Tim Hortons, weil die Touristen dann aufhören, Fahrten anzufragen und ich endlich Zeit zum Programmieren habe.
Mein aktuelles Setup ist erbärmlich: MacBook Pro von 2019 mit gesprungenem Bildschirm, Handy-Hotspot fürs Internet, der jedes Mal ausfällt, wenn ein Bus vorbeifährt, und ein Autositz, der nicht dafür gemacht wurde, dass Menschen acht Stunden damit verbringen, Python-Skripte zu debuggen. Mein Rücken ist dauerhaft verdreht vom Herumhängen über meinem Laptop in engen Räumen, und ich habe jedes 24-Stunden-Café zwischen Downtown und Richmond auswendig gelernt, weil sie die einzigen Orte mit verlässlichem WLAN und Toiletten sind.
Das KI-Entwicklungs-Ökosystem bewegt sich so schnell, dass jedes Tutorial, das ich mir merke, veraltet ist, bevor ich es zu Ende gelesen habe. OpenAI veröffentlicht ein neues Modell, Anthropic aktualisiert seine API, Google kündigt etwas an, das alles, woran ich arbeite, potenziell irrelevant macht. Ich baue ständig dieselben Funktionen neu, weil sich die zugrundeliegende Technologie geändert hat, während ich betrunkene Leute von der Granville Street nach Hause gefahren habe.
Produkt Eins: Die Sprachlern-Katastrophe
Mein erstes KI-Produkt sollte die Sprachlern-Revolution für Einwanderer in Vancouver sein. Denn nichts sagt „Ich verstehe meinen Markt" so sehr wie ein Typ, der nur Englisch spricht, und der Sprachlern-Tools für Leute baut, die Englisch lernen, oder?
Das Konzept schien solide: Ein KI-Tutor, der Neuankömmlingen hilft, Englisch mit Vancouver-spezifischen Szenarien zu üben. Kaffee bei JJ Bean bestellen, nach dem Weg zum VCC fragen, ein Gespräch mit einem Vermieter über BC Hydro-Rechnungen führen. Reale Situationen, auf die sie tatsächlich treffen, angetrieben von GPT-4 mit benutzerdefinierten Prompts, die den lokalen Kontext verstanden.
Ich habe drei Wochen damit verbracht, dieses Ding zwischen den Fahrten zu bauen. Am Parkplatz vor dem YVR geparkt und auf Flughafen-Fahrten gewartet, während ich Gesprächsabläufe programmierte. Um 2 Uhr morgens im McDonald's an der Robson gesessen und die KI auf Vancouver-Slang und lokale Bezüge trainiert. Die App konnte realistische Dialoge zu allem Möglichen generieren, von SkyTrain-Verspätungen bis hin zur Erklärung des Unterschieds zwischen Vancouver und North Vancouver für verwirrte Touristen.
Die technische Umsetzung war ein Desaster. Ich rede von State-Management, das nur durch Gebete zusammengehalten wurde, einem Datenbank-Schema, das um 4 Uhr morgens Sinn ergab, aber bei Debugging-Sitzungen am Tag wie abstrakte Kunst aussah. Die KI-Antworten waren inkonsistent – mal brillant, mal empfahl sie den Nutzern, Englisch zu üben, indem sie Fremde nach „den wunderschönen Bergen von Regina" fragten oder vorschlugen, die „Toronto Subway zum Stanley Park" zu nehmen.
Der Launchtag kam. Ich postete auf Reddit, teilte in einigen Facebook-Gruppen für Neuankömmlinge, überzeugte sogar ein paar Fahrgäste, es auszuprobieren. Das Feedback war ... lehrreich. Es stellte sich heraus, dass Leute, die Englisch lernen, nicht mit einer KI üben wollen, die gelegentlich vergisst, durch welche Stadt sie ihnen eigentlich helfen soll, sich zu navigieren. Ein Nutzer hinterließ eine Rezension, die mich immer noch verfolgt: „Die App sagte mir, ich solle das Bestellen von ‚Vancouver-style Pizza' üben. Ich habe an drei Orten gefragt. Niemand weiß, was das bedeutet. Die App auch nicht."
Gesamtnutzer nach zwei Monaten: minimale Verbreitung. Gelernte Lektion: Vielleicht sollte man seinen Zielmarkt verstehen, bevor man Lösungen für ihn baut.
Pivot auf einem Parkplatz
Produktversagen ist anders, wenn man zwischen Uber-Fahrten entwickelt. Es gibt kein Teammeeting, um nächste Schritte zu besprechen, keine Whiteboard-Session, um Pivots zu brainstormen. Nur ich, der um 1 Uhr morgens vor dem Cactus Club sitzt, auf Google Analytics starre, das null aktive Nutzer anzeigt, und versucht herauszufinden, was schiefgelaufen ist, während ich auf Fahranfragen warte.
Der Pivot kam an einem besonders langsamen Dienstagabend. Ich parkte vor einem Hotel in der Downtown, beobachtete, wie die Engagement-Metriken meiner Sprachlern-App auf Null gingen, als ich zwei Fahrgäste belauschte, die sich darüber unterhielten, wie unmöglich es sei, gute Content-Ersteller für den Blog ihres Startups zu finden. Sie brauchten technische Inhalte, schnell, und waren bereit, gut für qualitativ hochwertiges Schreiben zu bezahlen.
Geistesblitz: Was wäre, wenn ich einen KI-Schreibassistenten speziell für technische Inhalte baute? Nicht ein weiteres generisches KI-Schreibwerkzeug, sondern etwas, das speziell für SaaS-Unternehmen, Startups und Entwickler gemacht ist – Leute, die Inhalte brauchen, die sich nicht anhören, als wären sie von einem Roboter geschrieben, der versucht, SEO-Keyword-Ziele zu treffen.
Ich fing noch in dieser Nacht an zu bauen. Neues GitHub-Repo, neue Produktvision, derselbe gesprungene Laptop-Bildschirm und dieselbe schreckliche Haltung. Dieses Mal war ich klüger, was die Architektur anging – oder zumindest dachte ich das. Saubereres API-Design, bessere Datenbankstruktur, durchdachteres Prompt-Engineering. Die KI konnte technische Blogbeiträge, API-Dokumentationen, Produktbeschreibungen und sogar Code-Kommentare schreiben, die sich nicht anhörten, als wären sie von einem besonders geschwätzigen Zufallszahlengenerator erzeugt worden.
Der technische Albtraum, vor dem niemand warnt
KI-Produkte als Solo-Entwickler zu bauen ist, als wäre man ein Ein-Mann-Orchester, bei dem die Hälfte der Instrumente brennt und die Notenblätter sich mitten in der Aufführung ständig ändern. Jede Integration bricht anders. Jede API hat ihre eigene spezielle Art, katastrophal zu versagen.
OpenAIs API begann zufällig, Antworten zurückzugeben – in dem, was ich für Portugiesisch hielt – aber nur für bestimmte Prompt-Typen, nur dienstags, nur wenn Merkur rückläufig war. Anthropics Claude funktionierte wochenlang perfekt, entwickelte dann aber plötzlich starke Meinungen darüber, keine Marketingtexte zu schreiben, weil das „manipulativ" sein könnte. Ich verbrachte mehr Zeit damit, API-Eigenheiten zu verwalten, als tatsächliche Funktionen zu bauen.
Vektordatenbanken sind die ganz besondere Hölle, die für Indie-Entwickler reserviert ist, die dachten, das Speichern von Embeddings wäre einfach. Pinecone funktionierte großartig – bis es das nicht mehr tat. Weaviate hatte eine wunderschöne Dokumentation, die keinerlei Ähnlichkeit mit der tatsächlichen Funktionsweise hatte. Ich versuchte, meine eigene Vektorspeicherlösung zu bauen, und lernte ungefähr zu dem Zeitpunkt, warum das eine schlechte Idee ist, als mein Laptop während der Indizierungsvorgänge anfing, besorgniserregende Geräusche zu machen.
Die Infrastrukturkosten fraßen mich auf. Jedes Experiment, jeder Test, jedes Mal, wenn ich vergaß, ein ordentliches Rate-Limiting einzurichten – Geld flog aus meinem AWS-Konto schneller, als ich es verdienen konnte, indem ich Vancouvers Nachtschwärmer herumfuhr. Ich optimierte alles, woran ich denken konnte: kleinere Modelle für einfache Aufgaben, Response-Caching, aggressives Prompt-Engineering zur Reduzierung des Token-Verbrauchs. Trotzdem verbrannte ich Geld für Rechenkosten, während mein tatsächlicher Umsatz hartnäckig bei Null blieb.
Nutzer an unerwarteten Orten finden
Ein KI-Produkt aus dem Auto zu vermarkten, ist surreal. Ich poste Screenshots auf Twitter, während ich an roten Ampeln warte, antworte auf Hacker-News-Kommentare zwischen Fahrgast-Abholungen, versuche, ein Publikum potenzieller Kunden aufzubauen, während mein Hauptjob darin besteht, Leute herumzufahren, die keine Ahnung haben, dass ich nebenbei als Tech-Unternehmer arbeite.
Der Durchbruch kam aus einer unerwarteten Quelle: meinen Uber-Fahrgästen. Ich fing an, mein KI-Schreibwerkzeug jedem zu erwähnen, der aussah, als würde er im Tech-Bereich arbeiten. Vancouvers Startup-Szene ist überraschend klein, und anscheinend kennt jeder jeden. Eine Datenwissenschaftlerin, die ich von einem Coworking-Space in der Downtown zum YVR fuhr, probierte mein Werkzeug aus und liebte es. Sie stellte mich dem Marketing-Team ihres Startups vor. Sie wurden meine ersten zahlenden Kunden.
Die Nachricht verbreitete sich organisch in Vancouvers Tech-Community. Gespräche in Cafés, Netzwerkevents, an denen ich nicht teilnehmen konnte, weil ich fuhr, Slack-Gruppen, in denen meine ersten Nutzer mein Werkzeug mit ihren Kollegen teilten. Ich skalierte nicht über traditionelle Marketingkanäle – ich wuchs durch die seltsame Schnittmenge von Ride-Sharing und Tech-Networking, die es nur in Städten wie Vancouver gibt, wo jeder mit etwa zwei Grad Trennung verbunden ist.
Der Umsatz begann zu tröpfeln: bescheidene Beträge im ersten Monat, die in den Folgemonaten stetig wuchsen. Kein lebensveränderndes Geld, aber genug, um meine AWS-Rechnungen zu bezahlen und besseren Kaffee für diese 3-Uhr-morgens-Debugging-Sessions zu kaufen. Noch wichtiger: Die Leute nutzten tatsächlich, was ich gebaut hatte. Die KI generierte Inhalte, die echte Unternehmen veröffentlichten – Inhalte, die sich nicht anhörten, als kämen sie aus einer Content-Mühle oder einer Keyword-Stopffabrik.
Die Validierungsfalle
Erfolg ist gefährlich, wenn man allein entwickelt. Dieser erste Vorgeschmack auf Umsatz, diese anfänglichen positiven Nutzerbewertungen, die Zufriedenheit zu sehen, dass dein Code tatsächlich echte Probleme löst – das ist berauschend. Ich fing an zu denken, ich hätte es geknackt, den Code für die KI-Produktentwicklung geknackt, während ich in meinem Honda Civic saß.
Ich wurde übermütig. Fing an, Produkt Drei zu planen, bevor ich Produkt Zwei richtig skaliert hatte. Begann, ein ehrgeiziges KI-gestütztes Content-Management-System zu skizzieren, das revolutionieren sollte, wie kleine Unternehmen ihre gesamte Content-Pipeline handhaben. Die Scope Creep war real und spektakulär.
Währenddessen fragten meine bestehenden Nutzer nach grundlegenden Funktionen, die ich nicht gebaut hatte: bessere Content-Organisation, Kollaborationstools, Integrationen mit Plattformen, die sie tatsächlich nutzten. Statt zuzuhören, jagte ich der nächsten glänzenden KI-Fähigkeit hinterher und versuchte, etwas technisch Beeindruckendes zu bauen, anstatt etwas wirklich Nützliches.
Der Weckruf kam während eines besonders ehrlichen Gesprächs mit meinem größten Kunden, einem Startup, das mir bedeutende Beträge für ihre Content-Generierung zahlte. Sie liebten die Ausgabequalität der KI, aber das Werkzeug selbst war klobig und vermisste offensichtliche Funktionen. Sie kopierten Inhalte in Google Docs, um sie mit ihrem Team zu teilen, verfolgten manuell, was sie generiert hatten, führten Tabellenkalkulationen mit Content-Ideen, weil mein Produkt keinen dieser Arbeitsabläufe abdeckte.
Bauen, was die Leute tatsächlich wollen
Diese Feedback-Sitzung änderte alles. Ich hörte auf, an der großen Vision zu arbeiten, und fing an, die langweiligen Probleme zu beheben, mit denen meine tatsächlichen Nutzer jeden Tag zu kämpfen hatten. Bessere Dateiorganisation, Team-Kollaboration, Content-Kalender, Nutzungsanalysen, die Sinn ergaben. Keine sexy Funktionen, keine KI-Durchbrüche, einfach solide Produktentwicklung, die das Leben der Leute ein kleines bisschen einfacher machte.
Die technische Arbeit war weniger interessant, aber wichtiger. Richtige Benutzerauthentifizierung bauen, Dateifreigabe implementieren, Dashboard-Ansichten erstellen, die in unter drei Sekunden luden. Ich verbrachte mehr Zeit mit der Optimierung von Datenbankabfragen als mit dem Trainieren von KI-Modellen, mehr Zeit mit UX-Verbesserungen als mit Prompt-Engineering-Durchbrüchen.
Der Umsatz wuchs beständig Monat für Monat. Noch nicht genug, um mit Uber aufzuhören, aber genug, um darüber nachzudenken, wie dieser Übergang aussehen könnte. Meine Nutzer blieben, stiegen in höhere Tarife auf, empfahlen mich Kollegen weiter. Das Produkt wurde wirklich nützlich, anstatt nur technisch ausgeklügelt zu sein.
Der lange Weg vor uns
Ich fahre immer noch Uber, entwickle immer noch KI-Produkte zwischen den Fahrten, behebe immer noch Deployment-Probleme auf Parkplätzen in ganz Vancouver. Aber etwas hat sich geändert. Das ist nicht mehr nur ein Nebenprojekt – es wird zu einem echten Geschäft, langsam, chaotisch und auf eine Art und Weise, die ich nie erwartet hätte.
Das KI-Ökosystem bewegt sich immer noch schneller, als ich Schritt halten kann. Neue Modelle, neue Fähigkeiten, neue Konkurrenten, die jede Woche starten. Aber ich beginne zu verstehen, dass Erfolg nicht darin besteht, die fortschrittlichste KI oder die innovativsten Funktionen zu haben. Es geht darum, echte Probleme für echte Menschen zu lösen, konsequent und zuverlässig, selbst wenn deine Entwicklungsumgebung der Vordersitz eines Honda Civic von 2018 ist.
Es liegt noch ein langer Weg vor mir. Der Umsatz muss erheblich wachsen, bevor ich die Nachtschichten aufhören kann. Die Produkt-Roadmap ist voller Funktionen, die im Rückblick offensichtlich erscheinen, aber Wochen Entwicklungszeit erfordern, die ich Schlaf und Sozialleben stehle. Die Konkurrenz wächst, und VC-finanzierte Startups bauen ähnliche Werkzeuge mit Teams erfahrener Entwickler und Marketingbudgets, die mein Jahreseinkommen in den Schatten stellen.
Aber ich bin immer noch hier, baue immer noch auf und bin immer noch überzeugt, dass die Gründung eines KI-Unternehmens aus dem Auto heraus irgendwie ein tragfähiger Karriereweg ist. Vielleicht bin ich verrückt. Vielleicht geht dieses ganze Experiment spektakulär daneben und ich fahre die nächsten fünf Jahre Uber. Oder vielleicht, nur vielleicht, finde ich heraus, wie ich nächtliche Programmier-Sessions und Kundengespräche in etwas verwandeln kann, das einem echten Geschäft ähnelt. So oder so werde ich jeden Fehler dokumentieren, jeden kleinen Sieg, jeden Moment des Zweifels, ob das alles Sinn ergibt. Denn wenn ich eines gelernt habe beim Bau von KI-Produkten zwischen Uber-Fahrten, dann, dass die Reise seltsamer und lehrreicher ist als jedes Ergebnis, das ich hätte planen können.
Creando productos de IA entre viajes de Uber: mi diario de desarrollador delirante
Es pasada la medianoche y estoy sentado en mi Honda Civic afuera de una tienda de bubble tea en Commercial Drive, viendo cómo la batería de mi laptop se agota lentamente mientras depuro el fallo de integración de API más vergonzoso de mi vida. Los estudiantes universitarios borrachos que dejé hace cinco minutos pagaron en efectivo y se dirigieron tambaleándose hacia lo que supongo era su dormitorio, dejándome solo con mis pensamientos y un código base que es más espagueti que software. Esta es mi vida ahora: conductor de Uber en Vancouver por la noche, aspirante a emprendedor de IA durante las pausas de aumento de tarifa.
Hace seis meses, tenía cero experiencia en IA y un título en Ciencias de la Computación que no estaba usando. Ahora tengo tres productos de IA a medio terminar, un GitHub lleno de repositorios abandonados y suficientes correos de rechazo de inversores como para empapelar mi estudio en Burnaby. Pero sigo aquí, sigo creando, sigo convenciéndome de que el próximo despliegue será el que lo cambie todo.
La realidad que nadie menciona
Todos en Twitter hacen que el desarrollo independiente de IA parezca glamoroso. Publica una captura de pantalla de tu panel de ingresos, comparte una cita inspiradora sobre construir en público, mira cómo llegan los 'me gusta'. La realidad es más fea. Estoy construyendo productos en estacionamientos de Tim Hortons a las 3 AM porque es cuando los turistas dejan de solicitar viajes y realmente tengo tiempo para programar.
Mi configuración actual es patética: MacBook Pro 2019 con la pantalla rota, hotspot del teléfono para internet que se corta cada vez que pasa un autobús, y un asiento de auto que no fue diseñado para que los humanos pasen ocho horas depurando scripts de Python. Mi espalda está permanentemente torcida de tanto encorvarme sobre mi laptop en espacios reducidos, y me he memorizado todas las cafeterías abiertas 24 horas entre el centro y Richmond porque son los únicos lugares con WiFi confiable y baños.
El ecosistema de desarrollo de IA se mueve tan rápido que cualquier tutorial que marque como favorito queda obsoleto antes de que termine de leerlo. OpenAI lanza un nuevo modelo, Anthropic actualiza su API, Google anuncia algo que hace que todo en lo que estoy trabajando sea potencialmente irrelevante. Estoy constantemente reconstruyendo las mismas funciones porque la tecnología subyacente cambió mientras llevaba a gente borracha a casa desde Granville Street.
Producto uno: el desastre del aprendizaje de idiomas
Mi primer producto de IA iba a revolucionar el aprendizaje de idiomas para inmigrantes en Vancouver. Porque nada dice "entender tu mercado" como un tipo que solo habla inglés construyendo herramientas de idiomas para personas que aprenden inglés, ¿verdad?
El concepto parecía sólido: un tutor de IA que ayudara a los recién llegados a practicar inglés usando escenarios específicos de Vancouver. Pedir café en JJ Bean, preguntar direcciones hacia VCC, navegar una conversación con un arrendador sobre las facturas de BC Hydro. Situaciones reales que realmente encontrarían, impulsadas por GPT-4 con instrucciones personalizadas que entendieran el contexto local.
Pasé tres semanas construyendo esto entre viajes. Estacionado afuera de YVR esperando viajes al aeropuerto, programando flujos de conversación. Sentado en el McDonald's de Robson a las 2 AM, entrenando a la IA en jerga local de Vancouver y referencias locales. La aplicación podía generar diálogos realistas sobre cualquier cosa, desde retrasos del SkyTrain hasta explicar la diferencia entre Vancouver y North Vancouver a turistas confundidos.
La implementación técnica era un desastre. Hablo de gestión de estado mantenida con oraciones, un esquema de base de datos que tenía sentido a las 4 AM pero parecía arte abstracto durante sesiones de depuración diurnas. Las respuestas de la IA eran inconsistentes: a veces brillantes, a veces recomendando que los usuarios practicaran inglés preguntando a extraños sobre "las hermosas montañas de Regina" o sugiriendo que tomaran el "subway de Toronto a Stanley Park".
Llegó el día del lanzamiento. Publiqué en Reddit, compartí en algunos grupos de Facebook para recién llegados, incluso convencí a algunos pasajeros de probarlo. La retroalimentación fue... educativa. Resulta que las personas que aprenden inglés no quieren practicar con una IA que ocasionalmente olvida en qué ciudad se supone que debe ayudarlos a navegar. Un usuario dejó una reseña que aún me persigue: "La aplicación me dijo que practicara pidiendo 'pizza estilo Vancouver'. Pregunté en tres lugares. Nadie sabe qué significa eso. Tampoco la aplicación".
Usuarios totales después de dos meses: adopción mínima. Lecciones aprendidas: tal vez entiende tu mercado objetivo antes de construir soluciones para ellos.
Pivotando en un estacionamiento
El fracaso de un producto es diferente cuando construyes entre viajes de Uber. No hay reunión de equipo para discutir los próximos pasos, no hay sesión de pizarra para pensar en pivotes. Solo yo, sentado afuera de Cactus Club a la 1 AM, mirando Google Analytics que muestra cero usuarios activos, tratando de entender qué salió mal mientras monitoreo solicitudes de viaje.
El pivote llegó durante un martes por la noche particularmente lento. Estaba estacionado afuera de un hotel en el centro, viendo cómo las métricas de participación de mi aplicación de aprendizaje de idiomas se aplanaban, cuando escuché a dos pasajeros hablar sobre lo imposible que era encontrar buenos creadores de contenido para el blog de su startup. Necesitaban contenido técnico, lo necesitaban rápido, y estaban dispuestos a pagar bien por escritura de calidad.
Momento de bombilla: ¿Y si construía un asistente de escritura con IA específicamente para contenido técnico? No otra herramienta de escritura genérica con IA, sino algo diseñado a medida para empresas SaaS, startups, desarrolladores: personas que necesitaban contenido que no sonara escrito por un robot tratando de alcanzar objetivos de palabras clave SEO.
Empecé a construir esa noche. Nuevo repositorio en GitHub, nueva visión de producto, misma pantalla de laptop rota y mala postura. Esta vez fui más inteligente con la arquitectura, o al menos eso creía. Diseño de API más limpio, mejor estructura de base de datos, ingeniería de prompts más reflexiva. La IA podía escribir publicaciones de blog técnicas, documentación de API, descripciones de productos, incluso comentarios de código que no sonaban generados por un generador de números aleatorios particularmente verboso.
La pesadilla técnica que nadie advierte
Construir productos de IA como desarrollador en solitario es como ser una orquesta de una sola persona donde la mitad de los instrumentos están en llamas y la partitura cambia constantemente a media actuación. Cada integración se rompe de manera diferente. Cada API tiene su propia forma especial de fallar catastróficamente.
La API de OpenAI empezaba aleatoriamente a devolver respuestas en lo que creo que era portugués, pero solo para ciertos tipos de instrucciones, solo los martes, solo cuando Mercurio estaba retrógrado. Claude de Anthropic funcionaba perfectamente durante semanas, y luego de repente desarrollaba fuertes opiniones sobre no escribir copias de marketing porque podría ser "manipulador". Pasé más tiempo gestionando peculiaridades de API que construyendo funciones reales.
Las bases de datos vectoriales son el infierno especial reservado para desarrolladores independientes que pensaron que almacenar embeddings sería sencillo. Pinecone funcionaba genial hasta que dejó de hacerlo. Weaviate tenía una documentación hermosa que no se parecía en nada a cómo funcionaba realmente nada. Intenté construir mi propia solución de almacenamiento vectorial y aprendí por qué es mala idea, más o menos cuando mi laptop empezó a hacer ruidos preocupantes durante las operaciones de indexación.
Los costos de infraestructura me estaban comiendo vivo. Cada experimento, cada prueba, cada vez que olvidaba agregar limitación de tasa adecuada: dinero volando de mi cuenta de AWS más rápido de lo que podía ganarlo conduciendo por el público nocturno de Vancouver. Optimicé todo lo que pude pensar: modelos más pequeños para tareas simples, almacenamiento en caché de respuestas, ingeniería de prompts agresiva para reducir el uso de tokens. Aun así, quemando dinero en costos de cómputo mientras mis ingresos reales se mantenían obstinadamente en cero.
Encontrando usuarios en lugares inesperados
Comercializar un producto de IA desde tu auto es surrealista. Publico capturas de pantalla en Twitter mientras espero en semáforos en rojo, respondo a comentarios de Hacker News entre recogidas de pasajeros, trato de construir una audiencia de clientes potenciales mientras mi trabajo principal implica llevar gente que no tiene idea de que estoy trabajando como emprendedor tecnológico en mi tiempo libre.
El avance llegó de una fuente inesperada: mis pasajeros de Uber. Empecé a mencionar mi herramienta de escritura con IA a cualquiera que pareciera trabajar en tecnología. La escena startup de Vancouver es sorprendentemente pequeña, y aparentemente todo el mundo conoce a todo el mundo. Una científica de datos que llevé de un espacio de coworking del centro a YVR probó mi herramienta y le encantó. Me presentó al equipo de marketing de su startup. Se convirtieron en mis primeros clientes de pago.
La noticia se difundió orgánicamente a través de la comunidad tecnológica de Vancouver. Conversaciones en cafeterías, eventos de networking a los que no podía asistir porque estaba conduciendo, grupos de Slack donde mis primeros usuarios compartían mi herramienta con sus colegas. No estaba escalando a través de canales de marketing tradicionales, estaba creciendo a través de la extraña intersección de viajes compartidos y networking tecnológico que solo existe en ciudades como Vancouver donde todos están conectados por unos dos grados de separación.
Los ingresos empezaron a llegar: cantidades modestas el primer mes, creciendo constantemente en los meses siguientes. No es dinero que cambie la vida, pero suficiente para cubrir mis facturas de AWS y comprar mejor café para esas sesiones de depuración a las 3 AM. Más importante aún, la gente estaba realmente usando lo que había construido. La IA estaba generando contenido que empresas reales estaban publicando, contenido que no sonaba a que venía de un molino de contenido o una fábrica de relleno de palabras clave.
La trampa de la validación
El éxito es peligroso cuando construyes en solitario. Ese primer sabor de ingresos, esas primeras reseñas positivas de usuarios, la satisfacción de ver tu código realmente resolver problemas reales: es intoxicante. Empecé a pensar que lo había descubierto, que había descifrado el código del desarrollo de productos de IA mientras estaba sentado en mi Honda Civic.
Me volví arrogante. Empecé a planificar el Producto Tres antes de haber escalado adecuadamente el Producto Dos. Comencé a esbozar algún ambicioso sistema de gestión de contenido impulsado por IA que revolucionaría la forma en que las pequeñas empresas manejaban todo su flujo de contenido. La expansión del alcance era real y era espectacular.
Mientras tanto, mis usuarios existentes pedían funciones básicas que no había construido: mejor organización de contenido, herramientas de colaboración, integraciones con plataformas que realmente usaban. En lugar de escuchar, estaba persiguiendo la próxima capacidad brillante de IA, tratando de construir algo técnicamente impresionante en lugar de algo genuinamente útil.
La llamada de atención llegó durante una conversación particularmente honesta con mi cliente más grande, una startup que me pagaba considerablemente por su generación de contenido. Amaban la calidad de salida de la IA, pero la herramienta en sí era torpe y carecía de funciones obvias. Estaban copiando contenido a Google Docs para compartirlo con su equipo, rastreando manualmente lo que habían generado, manteniendo hojas de cálculo de ideas de contenido porque mi producto no manejaba nada de ese flujo de trabajo.
Construyendo lo que la gente realmente quiere
Esa sesión de retroalimentación lo cambió todo. Dejé de trabajar en la gran visión y empecé a arreglar los problemas aburridos que mis usuarios reales enfrentaban cada día. Mejor organización de archivos, colaboración en equipo, calendarios de contenido, análisis de uso que tuvieran sentido. No funciones sexys, no avances de IA, solo desarrollo de producto sólido que hiciera la vida de las personas marginalmente más fácil.
El trabajo técnico era menos interesante pero más importante. Construir autenticación de usuario adecuada, implementar intercambio de archivos, crear vistas de panel que cargaran en menos de tres segundos. Pasé más tiempo optimizando consultas de base de datos que entrenando modelos de IA, más tiempo en mejoras de UX que en avances de ingeniería de prompts.
Los ingresos crecieron constantemente mes tras mes. Todavía no lo suficiente para dejar Uber, pero suficiente para empezar a pensar en cómo podría ser esa transición. Mis usuarios se quedaban, actualizaban a niveles superiores, recomendaban a colegas. El producto se estaba volviendo genuinamente útil en lugar de solo técnicamente ingenioso.
El largo camino por delante
Todavía conduzco para Uber, todavía construyo productos de IA entre viajes, todavía depuro problemas de despliegue en estacionamientos de todo Vancouver. Pero algo ha cambiado. Esto ya no es solo un trabajo secundario: se está convirtiendo en un negocio real, lenta y desordenadamente, y de maneras que nunca esperé.
El ecosistema de IA sigue moviéndose más rápido de lo que puedo seguir. Nuevos modelos, nuevas capacidades, nuevos competidores lanzándose cada semana. Pero estoy empezando a entender que el éxito no se trata de tener la IA más avanzada o las funciones más innovadoras. Se trata de resolver problemas reales para personas reales, de manera consistente y confiable, incluso si tu entorno de desarrollo es el asiento delantero de un Honda Civic 2018.
Todavía queda un largo camino por recorrer. Los ingresos deben crecer sustancialmente antes de que pueda dejar de conducir por las noches. La hoja de ruta del producto está llena de funciones que parecen obvias en retrospectiva pero que requieren semanas de tiempo de desarrollo que estoy robando al sueño y la vida social. La competencia está aumentando, y las startups financiadas con capital de riesgo están construyendo herramientas similares con equipos de desarrolladores experimentados y presupuestos de marketing que empequeñecen mi ingreso anual.
Pero sigo aquí, sigo construyendo, sigo convencido de que iniciar una empresa de IA desde tu auto es de alguna manera una carrera profesional viable. Quizás estoy delirando. Quizás todo este experimento fracase espectacularmente y estaré conduciendo para Uber los próximos cinco años. O quizás, solo quizás, descubra cómo convertir sesiones de programación nocturnas y conversaciones con clientes en algo que se parezca a un negocio real. De cualquier manera, estaré documentando cada error, cada pequeña victoria, cada momento de cuestionar si todo esto tiene sentido. Porque si hay algo que he aprendido construyendo productos de IA entre viajes de Uber, es que el viaje es más extraño y más educativo que cualquier resultado que hubiera podido planificar.
Développer des Produits IA Entre Deux Courses Uber : Mon Journal Intime de Développeur Illusionné
Il est minuit passé et je suis assis dans ma Honda Civic devant un salon de bubble tea sur Commercial Drive, regardant la batterie de mon ordinateur portable mourir lentement pendant que je débogue l'échec d'intégration API le plus embarrassant de ma vie. Les étudiants ivres que j'ai déposés il y a cinq minutes ont payé en espèces et ont titubé vers ce que je suppose être leur dortoir, me laissant seul avec mes pensées et une base de code plus spaghetti que logiciel. C'est ma vie maintenant : chauffeur Uber à Vancouver la nuit, aspirant entrepreneur en IA pendant les creux de tarification dynamique.
Il y a six mois, j'avais zéro expérience en IA et un diplôme en informatique que je n'utilisais pas. Maintenant, j'ai trois produits IA à moitié terminés, un GitHub plein de dépôts abandonnés, et assez d'emails de refus d'investisseurs pour tapisser mon studio à Burnaby. Mais je suis toujours là, je construis toujours, me convainquant que le prochain déploiement sera celui qui changera tout.
La Réalité Dont Personne Ne Parle
Tout le monde sur Twitter rend le développement IA indépendant glamour. Postez une capture d'écran de votre tableau de bord de revenus, partagez une citation inspirante sur le fait de construire en public, regardez les likes arriver. La réalité est plus laide. Je construis des produits dans les parkings de Tim Hortons à 3 heures du matin parce que c'est à ce moment-là que les touristes arrêtent de demander des courses et que j'ai enfin le temps de coder.
Ma configuration actuelle est pitoyable : MacBook Pro 2019 avec un écran fissuré, un point d'accès téléphonique pour Internet qui se coupe à chaque fois qu'un bus passe, et un siège auto qui n'a pas été conçu pour que des humains passent huit heures à déboger des scripts Python. Mon dos est définitivement tordu à force de me pencher sur mon ordinateur portable dans des espaces exigus, et j'ai mémorisé tous les cafés ouverts 24h/24 entre le centre-ville et Richmond parce que ce sont les seuls endroits avec un WiFi fiable et des toilettes.
L'écosystème de développement IA évolue si vite que tout tutoriel que je mets en favori est obsolète avant que j'aie fini de le lire. OpenAI sort un nouveau modèle, Anthropic met à jour son API, Google annonce quelque chose qui rend tout ce sur quoi je travaille potentiellement sans intérêt. Je reconstruis constamment les mêmes fonctionnalités parce que la technologie sous-jacente a changé pendant que je ramenais des gens ivres chez eux depuis Granville Street.
Produit Numéro Un : Le Désastre de l'Apprentissage des Langues
Mon premier produit IA allait révolutionner l'apprentissage des langues pour les immigrants à Vancouver. Parce que rien ne dit « comprendre votre marché » comme un gars qui ne parle qu'anglais construisant des outils linguistiques pour des gens qui apprennent l'anglais, n'est-ce pas ?
Le concept semblait solide : un tuteur IA qui aide les nouveaux arrivants à pratiquer l'anglais en utilisant des scénarios spécifiques à Vancouver. Commander un café chez JJ Bean, demander son chemin vers VCC, gérer une conversation avec un propriétaire au sujet des factures de BC Hydro. Des situations réelles qu'ils rencontreraient réellement, propulsées par GPT-4 avec des invites personnalisées qui comprennent le contexte local.
J'ai passé trois semaines à construire ce truc entre les courses. Garé devant YVR en attendant des trajets vers l'aéroport, à coder des flux de conversation. Assis au McDonald's sur Robson à 2 heures du matin, à former l'IA sur l'argot et les références locales de Vancouver. L'application pouvait générer des dialogues réalistes sur n'importe quoi, des retards du SkyTrain à expliquer la différence entre Vancouver et North Vancouver aux touristes confus.
L'implémentation technique était un désastre. Je parle de gestion d'état maintenue par la prière, d'un schéma de base de données qui avait du sens à 4 heures du matin mais ressemblait à de l'art abstrait lors des sessions de débogage diurnes. Les réponses de l'IA étaient incohérentes — parfois brillantes, parfois recommandant aux utilisateurs de pratiquer l'anglais en demandant à des inconnus à propos des « magnifiques montagnes de Regina » ou en suggérant de prendre le « métro de Toronto jusqu'à Stanley Park ».
Le jour du lancement est arrivé. J'ai posté sur Reddit, partagé dans quelques groupes Facebook pour nouveaux arrivants, même convaincu quelques passagers de l'essayer. Les retours étaient... instructifs. Il s'avère que les gens qui apprennent l'anglais ne veulent pas pratiquer avec une IA qui oublie parfois dans quelle ville elle est censée les aider à naviguer. Un utilisateur a laissé un avis qui me hante encore : « L'application m'a dit de pratiquer la commande de 'pizza style Vancouver.' J'ai demandé dans trois endroits. Personne ne sait ce que ça veut dire. L'application non plus. »
Nombre total d'utilisateurs après deux mois : adoption minimale. Leçons apprises : Peut-être comprendre votre marché cible avant de construire des solutions pour lui.
Pivoter dans un Parking
L'échec d'un produit est différent quand on construit entre les courses Uber. Il n'y a pas de réunion d'équipe pour discuter des prochaines étapes, pas de session de brainstorming pour imaginer des pivots. Juste moi, assis devant Cactus Club à 1 heure du matin, fixant Google Analytics qui montre zéro utilisateur actif, essayant de comprendre ce qui a mal tourné tout en surveillant les demandes de course.
Le pivot est venu lors d'une soirée particulièrement lente du mardi. J'étais garé devant un hôtel au centre-ville, regardant les métriques d'engagement de mon application d'apprentissage des langues stagner, quand j'ai surpris deux passagers parlant de la difficulté de trouver de bons créateurs de contenu pour le blog de leur startup. Ils avaient besoin de contenu technique, rapidement, et étaient prêts à payer cher pour une rédaction de qualité.
Moment de prise de conscience : Et si je construisais un assistant d'écriture IA spécifiquement pour le contenu technique ? Pas un autre outil d'écriture IA générique, mais quelque chose de conçu spécialement pour les entreprises SaaS, les startups, les développeurs — des gens qui ont besoin de contenu qui ne sonne pas comme s'il avait été écrit par un robot essayant d'atteindre des objectifs de mots-clés SEO.
J'ai commencé à construire cette nuit-là. Nouveau dépôt GitHub, nouvelle vision produit, même écran fissuré et mauvaise posture. Cette fois, j'étais plus intelligent sur l'architecture — du moins je le pensais. Conception d'API plus propre, meilleure structure de base de données, ingénierie des invites plus réfléchie. L'IA pouvait écrire des articles de blog techniques, de la documentation d'API, des descriptions de produits, même des commentaires de code qui ne sonnaient pas comme s'ils étaient générés par un générateur de nombres aléatoires particulièrement verbeux.
Le Cauchemar Technique Dont Personne Ne Vous Avertit
Construire des produits IA en tant que développeur solo, c'est comme être un orchestre à une seule personne où la moitié des instruments sont en feu et la partition ne cesse de changer en pleine performance. Chaque intégration casse différemment. Chaque API a sa propre façon spéciale d'échouer de manière catastrophique.
L'API d'OpenAI se mettait aléatoirement à renvoyer des réponses dans ce que je pense être du portugais, mais seulement pour certains types d'invite, seulement le mardi, seulement quand Mercure était rétrograde. Claude d'Anthropic fonctionnait parfaitement pendant des semaines, puis développait soudainement de fortes opinions sur le fait de ne pas écrire de contenu marketing parce que cela pourrait être « manipulateur ». Je passais plus de temps à gérer les bizarreries des API qu'à construire des fonctionnalités réelles.
Les bases de données vectorielles sont l'enfer spécial réservé aux développeurs indépendants qui pensaient que stocker des embeddings serait simple. Pinecone fonctionnait très bien jusqu'à ce que ce ne soit plus le cas. Weaviate avait une documentation magnifique qui ne ressemblait en rien à la façon dont les choses fonctionnaient réellement. J'ai essayé de construire ma propre solution de stockage vectoriel et j'ai appris pourquoi c'est une mauvaise idée à peu près au moment où mon ordinateur portable a commencé à faire des bruits inquiétants pendant les opérations d'indexation.
Les coûts d'infrastructure me bouffaient vivant. Chaque expérience, chaque test, chaque fois que j'oubliais d'ajouter une limitation de débit appropriée — l'argent s'envolait de mon compte AWS plus vite que je ne pouvais le gagner en conduisant les noctambules de Vancouver. J'ai optimisé tout ce à quoi je pouvais penser : modèles plus petits pour les tâches simples, mise en cache des réponses, ingénierie des invites agressive pour réduire l'utilisation des tokens. Je brûlais toujours de l'argent en coûts de calcul tandis que mon revenu réel restait obstinément à zéro.
Trouver des Utilisateurs dans des Endroits Inattendus
Commercialiser un produit IA depuis sa voiture est surréaliste. Je poste des captures d'écran sur Twitter en attendant aux feux rouges, je réponds aux commentaires sur Hacker News entre deux prises en charge de passagers, j'essaie de construire une audience de clients potentiels alors que mon travail principal consiste à conduire des gens qui n'ont aucune idée que je suis un entrepreneur technologique à mes heures perdues.
La percée est venue d'une source inattendue : mes passagers Uber. J'ai commencé à mentionner mon outil d'écriture IA à quiconque avait l'air de travailler dans la tech. La scène startup de Vancouver est étonnamment petite, et apparemment tout le monde connaît tout le monde. Une data scientist que j'ai conduite d'un espace de coworking du centre-ville à YVR a essayé mon outil et l'a adoré. Elle m'a présenté à l'équipe marketing de sa startup. Ils sont devenus mes premiers clients payants.
Le bouche-à-oreille s'est propagé organiquement dans la communauté tech de Vancouver. Conversations dans les cafés, événements de réseautage auxquels je ne pouvais pas assister parce que je conduisais, groupes Slack où mes premiers utilisateurs partageaient mon outil avec leurs collègues. Je ne grandissais pas par les canaux marketing traditionnels — je grandissais à travers l'intersection étrange du covoiturage et du réseautage tech qui n'existe que dans des villes comme Vancouver où tout le monde est connecté par environ deux degrés de séparation.
Les revenus ont commencé à arriver au compte-gouttes : des montants modestes le premier mois, augmentant régulièrement les mois suivants. Pas de quoi changer une vie, mais assez pour couvrir mes factures AWS et acheter un meilleur café pour ces sessions de débogage à 3 heures du matin. Plus important encore, les gens utilisaient réellement ce que j'avais construit. L'IA générait du contenu que de vraies entreprises publiaient, du contenu qui ne sonnait pas comme s'il venait d'une usine à contenu ou d'une fabrique de bourrage de mots-clés.
Le Piège de la Validation
Le succès est dangereux quand on construit en solo. Ce premier goût de revenus, ces premiers avis utilisateurs positifs, la satisfaction de voir votre code résoudre réellement des problèmes concrets — c'est enivrant. J'ai commencé à penser que j'avais trouvé la solution, que j'avais percé le code du développement de produits IA assis dans ma Honda Civic.
Je suis devenu arrogant. J'ai commencé à planifier le Produit Trois avant d'avoir correctement mis à l'échelle le Produit Deux. J'ai commencé à esquisser un système de gestion de contenu IA ambitieux qui révolutionnerait la façon dont les petites entreprises géraient l'ensemble de leur pipeline de contenu. La dérive du périmètre était réelle et spectaculaire.
Pendant ce temps, mes utilisateurs existants demandaient des fonctionnalités de base que je n'avais pas construites : meilleure organisation du contenu, outils de collaboration, intégrations avec les plateformes qu'ils utilisaient réellement. Au lieu d'écouter, je courais après la prochaine capacité IA brillante, essayant de construire quelque chose d'impressionnant techniquement plutôt que quelque chose de vraiment utile.
Le signal d'alarme est venu lors d'une conversation particulièrement honnête avec mon plus gros client, une startup qui me payait significativement pour sa génération de contenu. Ils adoraient la qualité de sortie de l'IA, mais l'outil lui-même était maladroit et manquait de fonctionnalités évidentes. Ils copiaient le contenu dans Google Docs pour le partager avec leur équipe, suivaient manuellement ce qu'ils avaient généré, tenaient des feuilles de calcul d'idées de contenu parce que mon produit ne gérait aucune de ces tâches.
Construire Ce Dont Les Gens Ont Vraiment Besoin
Cette session de feedback a tout changé. J'ai arrêté de travailler sur la grande vision et j'ai commencé à résoudre les problèmes ennuyeux auxquels mes utilisateurs réels étaient confrontés quotidiennement. Meilleure organisation des fichiers, collaboration d'équipe, calendriers de contenu, analyses d'utilisation qui avaient du sens. Pas de fonctionnalités sexy, pas de percées IA, juste un développement produit solide qui rendait la vie des gens un peu plus facile.
Le travail technique était moins intéressant mais plus important. Construire une authentification utilisateur appropriée, implémenter le partage de fichiers, créer des vues de tableau de bord qui se chargeaient en moins de trois secondes. J'ai passé plus de temps à optimiser les requêtes de base de données qu'à former des modèles IA, plus de temps sur les améliorations UX que sur les percées d'ingénierie des invites.
Les revenus ont augmenté régulièrement mois après mois. Pas encore assez pour quitter Uber, mais assez pour commencer à réfléchir à quoi cette transition pourrait ressembler. Mes utilisateurs restaient, passaient à des niveaux supérieurs, recommandaient des collègues. Le produit devenait vraiment utile plutôt que simplement astucieux techniquement.
La Longue Route Devant Moi
Je conduis toujours pour Uber, je construis toujours des produits IA entre les courses, je débogue toujours des problèmes de déploiement dans des parkings à travers Vancouver. Mais quelque chose a changé. Ce n'est plus juste une activité secondaire — ça devient une vraie entreprise, lentement et en désordre et d'une manière que je n'avais jamais imaginée.
L'écosystème IA évolue toujours plus vite que je ne peux suivre. Nouveaux modèles, nouvelles capacités, nouveaux concurrents qui lancent chaque semaine. Mais je commence à comprendre que le succès ne consiste pas à avoir l'IA la plus avancée ou les fonctionnalités les plus innovantes. Il s'agit de résoudre de vrais problèmes pour de vraies personnes, de manière cohérente et fiable, même si votre environnement de développement est le siège avant d'une Honda Civic 2018.
Il y a encore un long chemin à parcourir. Les revenus doivent augmenter considérablement avant que je puisse arrêter de conduire la nuit. La feuille de route du produit est pleine de fonctionnalités qui semblent évidentes rétrospectivement mais qui nécessitent des semaines de temps de développement que je vole au sommeil et à la vie sociale. La concurrence augmente, et les startups financées par du capital-risque construisent des outils similaires avec des équipes de développeurs expérimentés et des budgets marketing qui éclipsent mon revenu annuel.
Mais je suis toujours là, je construis toujours, toujours convaincu que lancer une entreprise IA depuis sa voiture est une voie de carrière viable. Peut-être que je suis illusionné. Peut-être que toute cette expérience va échouer de manière spectaculaire et je conduirai pour Uber pendant les cinq prochaines années. Ou peut-être, juste peut-être, que je vais trouver comment transformer des sessions de codage tardives et des conversations avec des clients en quelque chose qui ressemble à une vraie entreprise. Quoi qu'il en soit, je documenterai chaque erreur, chaque petite victoire, chaque moment de doute pour savoir si tout cela a un sens. Parce que s'il y a une chose que j'ai apprise en développant des produits IA entre les courses Uber, c'est que le voyage est plus étrange et plus instructif que tout résultat que j'aurais pu planifier.
उबर राइड्स के बीच AI प्रोडक्ट बनाना: मेरी भ्रामक डेवलपर डायरी
रात के बारह बज चुके हैं और मैं Commercial Drive पर एक बबल टी की दुकान के बाहर अपनी Honda Civic में बैठा हूँ, अपने लैपटॉप की बैटरी को धीरे-धीरे खत्म होते देख रहा हूँ जबकि मैं अपने जीवन की सबसे शर्मनाक API इंटीग्रेशन विफलता को डीबग कर रहा हूँ। जिन शराबी यूनिवर्सिटी के छात्रों को मैं पाँच मिनट पहले छोड़ आया, उन्होंने नकद भुगतान किया और वहाँ से लड़खड़ाते हुए चले गए जो मुझे लगता है कि उनका डॉर्म रूम था, मुझे मेरे विचारों और एक कोडबेस के साथ अकेला छोड़कर जो सॉफ्टवेयर से ज्यादा स्पेगेटी है। यह अब मेरी ज़िंदगी है: रात में Vancouver का Uber ड्राइवर, सर्ज प्राइसिंग की सुस्ती के दौरान AI उद्यमी बनने का इच्छुक।
छह महीने पहले, मेरे पास शून्य AI अनुभव था और एक कंप्यूटर साइंस की डिग्री थी जिसका मैं उपयोग नहीं कर रहा था। अब मेरे पास तीन अधूरे AI प्रोडक्ट हैं, एक GitHub जो परित्यक्त रिपॉजिटरी से भरा हुआ है, और निवेशकों से इतने सारे रिजेक्शन ईमेल हैं कि Burnaby में अपने स्टूडियो अपार्टमेंट की दीवारों पर वॉलपेपर लगा सकूँ। लेकिन मैं अभी भी यहाँ हूँ, अभी भी बना रहा हूँ, अभी भी खुद को समझा रहा हूँ कि अगली डिप्लॉयमेंट वही होगी जो सब कुछ बदल देगी।
वो रियलिटी चेक जिसके बारे में कोई बात नहीं करता
हर कोई Twitter पर इंडी AI डेवलपमेंट को ग्लैमरस दिखाता है। अपने रेवेन्यू डैशबोर्ड का स्क्रीनशॉट पोस्ट करें, पब्लिक में बिल्ड करने के बारे में कोई प्रेरक उद्धरण साझा करें, लाइक्स आते देखें। हकीकत इससे कहीं बदसूरत है। मैं रात के 3 बजे Tim Hortons के पार्किंग लॉट में प्रोडक्ट बना रहा हूँ क्योंकि तब पर्यटक राइड माँगना बंद कर देते हैं और मेरे पास वास्तव में कोड करने का समय होता है।
मेरा मौजूदा सेटअप दयनीय है: 2019 MacBook Pro जिसकी स्क्रीन फटी हुई है, इंटरनेट के लिए फोन का हॉटस्पॉट जो हर बार जब कोई बस गुज़रती है तो कट जाता है, और एक कार सीट जो इंसानों को आठ घंटे Python स्क्रिप्ट डीबग कराने के लिए नहीं बनाई गई थी। मेरी पीठ हमेशा के लिए मुड़ गई है क्योंकि मैं तंग जगहों में अपने लैपटॉप पर झुकता हूँ, और मैंने Downtown और Richmond के बीच हर 24 घंटे खुले रहने वाले कॉफी शॉप को याद कर लिया है क्योंकि वे विश्वसनीय WiFi और शौचालय वाली एकमात्र जगहें हैं।
AI डेवलपमेंट इकोसिस्टम इतनी तेज़ी से आगे बढ़ रहा है कि मैं जिस भी ट्यूटोरियल को बुकमार्क करता हूँ, वह पढ़ने से पहले ही पुराना हो जाता है। OpenAI एक नया मॉडल रिलीज़ करता है, Anthropic अपना API अपडेट करता है, Google कुछ ऐसा घोषित करता है जो मैं जो कुछ भी कर रहा हूँ उसे संभावित रूप से अप्रासंगिक बना देता है। मैं लगातार उन्हीं फीचर्स को फिर से बना रहा हूँ क्योंकि अंतर्निहित तकनीक बदल गई जब मैं Granville Street से लोगों को शराब के नशे में घर ले जा रहा था।
प्रोडक्ट एक: भाषा सीखने की आपदा
मेरा पहला AI प्रोडक्ट Vancouver में प्रवासियों के लिए भाषा सीखने में क्रांति लाने वाला था। क्योंकि "अपने बाजार को समझना" ऐसे व्यक्ति से बेहतर कुछ नहीं दर्शाता जो केवल अंग्रेजी बोलता है और उन लोगों के लिए भाषा उपकरण बना रहा है जो अंग्रेजी सीख रहे हैं, है न?
अवधारणा ठोस लग रही थी: एक AI ट्यूटर जो नए लोगों को Vancouver-विशिष्ट परिदृश्यों का उपयोग करके अंग्रेजी का अभ्यास करने में मदद करे। JJ Bean पर कॉफी ऑर्डर करना, VCC के लिए रास्ता पूछना, BC Hydro के बिलों के बारे में मकान मालिक के साथ बातचीत करना। वास्तविक स्थितियाँ जिनका वे वास्तव में सामना करेंगे, GPT-4 द्वारा संचालित और कस्टम प्रॉम्प्ट के साथ जो स्थानीय संदर्भ को समझते हों।
मैंने इस चीज़ को बनाने में राइड्स के बीच तीन हफ्ते बिताए। YVR के बाहर एयरपोर्ट रन का इंतज़ार करते हुए पार्क करके, बातचीत के फ्लो को कोड करता रहा। Robson पर McDonald's में रात के 2 बजे बैठकर, AI को Vancouver स्लैंग और स्थानीय संदर्भों पर ट्रेनिंग देता रहा। ऐप SkyTrain देरी से लेकर भ्रमित पर्यटकों को Vancouver और North Vancouver के बीच अंतर समझाने तक, किसी भी चीज़ के बारे में यथार्थवादी संवाद उत्पन्न कर सकता था।
तकनीकी कार्यान्वयन गड़बड़ था। मैं बात कर रहा हूँ प्रार्थना द्वारा संभाले गए स्टेट मैनेजमेंट की, एक डेटाबेस स्कीमा की जो सुबह के 4 बजे समझ में आता था लेकिन दिन के उजाले में डीबगिंग सेशन के दौरान एब्सट्रैक्ट आर्ट जैसा दिखता था। AI प्रतिक्रियाएँ असंगत थीं — कभी शानदार, कभी यह सुझाव देती थीं कि उपयोगकर्ता अजनबियों से "Regina के खूबसूरत पहाड़ों" के बारे में पूछकर अंग्रेजी का अभ्यास करें या उन्हें "Stanley Park के लिए Toronto सबवे" लेने का सुझाव देती थीं।
लॉन्च का दिन आया। मैंने Reddit पर पोस्ट किया, नए लोगों के लिए कुछ Facebook ग्रुप में शेयर किया, यहाँ तक कि कुछ यात्रियों को इसे आज़माने के लिए मना लिया। फीडबैक था... शिक्षाप्रद। पता चला कि जो लोग अंग्रेजी सीख रहे हैं, वे एक ऐसे AI के साथ अभ्यास नहीं करना चाहते जो कभी-कभी भूल जाता है कि उसे उन्हें किस शहर में नेविगेट करने में मदद करनी है। एक उपयोगकर्ता ने एक समीक्षा छोड़ी जो अब भी मुझे परेशान करती है: "ऐप ने मुझे 'Vancouver-style पिज़्ज़ा' ऑर्डर करने का अभ्यास करने को कहा। मैंने तीन जगहों पर पूछा। किसी को नहीं पता कि इसका क्या मतलब है। ऐप को भी नहीं पता।"
दो महीने बाद कुल उपयोगकर्ता: न्यूनतम अपनाने की दर। सीखे गए सबक: शायद उनके लिए समाधान बनाने से पहले अपने लक्षित बाजार को समझें।
पार्किंग लॉट में पिवट करना
प्रोडक्ट विफलता तब अलग होती है जब आप Uber राइड्स के बीच बना रहे हों। अगले कदमों पर चर्चा करने के लिए कोई टीम मीटिंग नहीं, पिवट पर विचार-मंथन करने के लिए कोई व्हाइटबोर्ड सेशन नहीं। बस मैं, रात के 1 बजे Cactus Club के बाहर बैठा, Google Analytics पर शून्य सक्रिय उपयोगकर्ता दिखाते हुए घूर रहा हूँ, यह पता लगाने की कोशिश कर रहा हूँ कि क्या गलत हुआ जबकि राइड अनुरोधों पर नज़र रख रहा हूँ।
पिवट एक विशेष रूप से सुस्त मंगलवार की रात आया। मैं Downtown में एक होटल के बाहर पार्क किया हुआ था, अपने भाषा सीखने वाले ऐप के एंगेजमेंट मेट्रिक्स को फ्लैटलाइन होते देख रहा था, जब मैंने दो यात्रियों को बात करते सुना कि उनके स्टार्टअप के ब्लॉग के लिए अच्छे कंटेंट क्रिएटर ढूँढना कितना असंभव है। उन्हें तकनीकी सामग्री चाहिए थी, उन्हें तेज़ चाहिए थी, और वे गुणवत्ता लेखन के लिए अच्छा भुगतान करने को तैयार थे।
लाइटबल्ब पल: क्या होगा अगर मैं विशेष रूप से तकनीकी सामग्री के लिए एक AI राइटिंग असिस्टेंट बनाऊँ? कोई और सामान्य AI राइटिंग टूल नहीं, बल्कि SaaS कंपनियों, स्टार्टअप्स, डेवलपर्स के लिए उद्देश्य-निर्मित कुछ — ऐसे लोग जिन्हें ऐसी सामग्री चाहिए जो SEO कीवर्ड टार्गेट को हिट करने की कोशिश कर रहे रोबोट द्वारा लिखी गई न लगे।
मैंने उसी रात बनाना शुरू किया। नया GitHub रेपो, नया प्रोडक्ट विज़न, वही फटी लैपटॉप स्क्रीन और भयानक मुद्रा। इस बार मैं आर्किटेक्चर के बारे में ज़्यादा होशियार था — या कम से कम मुझे ऐसा लगा। साफ़ API डिज़ाइन, बेहतर डेटाबेस संरचना, अधिक विचारशील प्रॉम्प्ट इंजीनियरिंग। AI तकनीकी ब्लॉग पोस्ट, API दस्तावेज़ीकरण, प्रोडक्ट विवरण, यहाँ तक कि कोड टिप्पणियाँ भी लिख सकता था जो किसी विशेष रूप से वाचाल रैंडम नंबर जनरेटर द्वारा उत्पन्न नहीं लगती थीं।
वो तकनीकी दुःस्वप्न जिसके बारे में कोई चेतावनी नहीं देता
एकल डेवलपर के रूप में AI प्रोडक्ट बनाना एक व्यक्ति के ऑर्केस्ट्रा की तरह है जहाँ आधे उपकरणों में आग लगी हो और शीट म्यूज़िक प्रदर्शन के बीच में बदलता रहे। हर इंटीग्रेशन अलग तरीके से टूटता है। हर API के पास विनाशकारी रूप से विफल होने का अपना विशेष तरीका है।
OpenAI का API बेतरतीब ढंग से पुर्तगाली में प्रतिक्रियाएँ लौटाने लगता था, लेकिन केवल कुछ खास प्रॉम्प्ट प्रकारों के लिए, केवल मंगलवार को, केवल जब बुध वक्री होता था। Anthropic का Claude हफ्तों तक पूरी तरह से काम करता था, फिर अचानक मार्केटिंग कॉपी न लिखने के बारे में मजबूत राय विकसित कर लेता था क्योंकि यह "जोड़-तोड़" हो सकता है। मैंने वास्तविक फीचर बनाने की तुलना में API की विचित्रताओं को प्रबंधित करने में अधिक समय बिताया।
वेक्टर डेटाबेस वह विशेष नरक है जो उन इंडी डेवलपर्स के लिए आरक्षित है जिन्होंने सोचा कि एम्बेडिंग स्टोर करना सीधा होगा। Pinecone ने तब तक बढ़िया काम किया जब तक उसने नहीं किया। Weaviate के पास सुंदर दस्तावेज़ीकरण था जिसका वास्तविक कामकाज से कोई संबंध नहीं था। मैंने अपना खुद का वेक्टर स्टोरेज समाधान बनाने की कोशिश की और सीखा कि वह एक बुरा विचार क्यों है, लगभग उसी समय जब इंडेक्सिंग ऑपरेशन के दौरान मेरा लैपटॉप चिंताजनक आवाजें करने लगा।
इंफ्रास्ट्रक्चर की लागत मुझे खा रही थी। हर प्रयोग, हर टेस्ट, हर बार जब मैं उचित रेट लिमिटिंग लगाना भूल गया — पैसा मेरे AWS खाते से उड़ रहा था, उससे कहीं तेज़ जितना मैं Vancouver की रात की भीड़ को गाड़ी चलाकर कमा सकता था। मैंने हर उस चीज़ को ऑप्टिमाइज़ किया जिसके बारे में मैं सोच सकता था: सरल कार्यों के लिए छोटे मॉडल, रिस्पॉन्स कैशिंग, टोकन उपयोग को कम करने के लिए आक्रामक प्रॉम्प्ट इंजीनियरिंग। फिर भी कंप्यूट लागत पर पैसा जल रहा था जबकि मेरा वास्तविक राजस्व हठपूर्वक शून्य पर बना हुआ था।
अप्रत्याशित स्थानों में उपयोगकर्ता ढूँढना
अपनी कार से AI प्रोडक्ट का मार्केटिंग करना असली है। मैं लाल बत्ती पर इंतज़ार करते हुए Twitter पर स्क्रीनशॉट पोस्ट कर रहा हूँ, यात्रियों को लेने के बीच Hacker News टिप्पणियों का जवाब दे रहा हूँ, संभावित ग्राहकों का एक दर्शक वर्ग बनाने की कोशिश कर रहा हूँ जबकि मेरी प्राथमिक नौकरी में लोगों को इधर-उधर ले जाना शामिल है जिन्हें कोई अंदाज़ा नहीं है कि मैं एक टेक उद्यमी के रूप में अंशकालिक काम कर रहा हूँ।
सफलता एक अप्रत्याशित स्रोत से मिली: मेरे Uber यात्री। मैंने अपने AI राइटिंग टूल का उल्लेख उन सभी से करना शुरू कर दिया जो टेक में काम करते दिखते थे। Vancouver का स्टार्टअप दृश्य आश्चर्यजनक रूप से छोटा है, और जाहिर तौर पर हर कोई हर किसी को जानता है। एक डेटा वैज्ञानिक जिसे मैंने Downtown के एक कोवर्किंग स्पेस से YVR ले गया, उसने मेरे टूल को आज़माया और इसे पसंद किया। उसने मेरा परिचय अपनी स्टार्टअप की मार्केटिंग टीम से कराया। वे मेरे पहले भुगतान करने वाले ग्राहक बने।
शब्द Vancouver के टेक समुदाय में स्वाभाविक रूप से फैल गया। कॉफी शॉप की बातचीत, नेटवर्किंग इवेंट जिनमें मैं शामिल नहीं हो सका क्योंकि मैं गाड़ी चला रहा था, Slack ग्रुप जहाँ मेरे शुरुआती उपयोगकर्ताओं ने मेरे टूल को अपने सहकर्मियों के साथ साझा किया। मैं पारंपरिक मार्केटिंग चैनलों के माध्यम से स्केल नहीं कर रहा था — मैं राइड-शेयरिंग और टेक नेटवर्किंग के अजीब चौराहे के माध्यम से बढ़ रहा था जो केवल Vancouver जैसे शहरों में मौजूद है जहाँ हर कोई लगभग दो डिग्री अलगाव से जुड़ा हुआ है।
राजस्व टपकने लगा: पहले महीने मामूली रकम, बाद के महीनों में लगातार बढ़ती गई। जीवन बदलने वाला पैसा नहीं, लेकिन मेरे AWS बिलों को कवर करने और उन 3 AM डीबगिंग सेशन के लिए बेहतर कॉफी खरीदने के लिए पर्याप्त। इससे भी महत्वपूर्ण बात, लोग वास्तव में उपयोग कर रहे थे जो मैंने बनाया था। AI ऐसी सामग्री उत्पन्न कर रहा था जिसे वास्तविक कंपनियाँ प्रकाशित कर रही थीं, ऐसी सामग्री जो कंटेंट मिल या कीवर्ड स्टफिंग फैक्ट्री से नहीं आई लगती थी।
मान्यता का जाल
जब आप अकेले निर्माण कर रहे हों तो सफलता खतरनाक होती है। राजस्व का वह पहला स्वाद, वे प्रारंभिक सकारात्मक उपयोगकर्ता समीक्षाएँ, आपके कोड को वास्तविक समस्याओं को हल करते देखने की संतुष्टि — यह नशीला है। मैंने सोचना शुरू कर दिया कि मैंने यह पता लगा लिया है, कि मैंने अपनी Honda Civic में बैठे-बैठे AI प्रोडक्ट डेवलपमेंट का कोड क्रैक कर लिया है।
मैं अभिमानी हो गया। प्रोडक्ट दो को ठीक से स्केल करने से पहले ही प्रोडक्ट तीन की योजना बनाने लगा। एक महत्वाकांक्षी AI-संचालित कंटेंट मैनेजमेंट सिस्टम की रूपरेखा बनाने लगा जो छोटे व्यवसायों के अपने संपूर्ण कंटेंट पाइपलाइन को संभालने के तरीके में क्रांति ला देगा। स्कोप क्रीप वास्तविक थी और यह शानदार थी।
इस बीच, मेरे मौजूदा उपयोगकर्ता बुनियादी फीचर माँग रहे थे जो मैंने नहीं बनाए थे: बेहतर कंटेंट ऑर्गनाइज़ेशन, सहयोग उपकरण, उन प्लेटफार्मों के साथ इंटीग्रेशन जिनका वे वास्तव में उपयोग करते थे। सुनने के बजाय, मैं अगली चमकदार AI क्षमता का पीछा कर रहा था, कुछ तकनीकी रूप से प्रभावशाली बनाने की कोशिश कर रहा था बजाय कुछ वास्तव में उपयोगी के।
जागृति का क्षण मेरे सबसे बड़े ग्राहक, एक स्टार्टअप जो मुझे उनकी कंटेंट जनरेशन के लिए अच्छी रकम दे रहा था, के साथ एक विशेष रूप से ईमानदार बातचीत के दौरान आया। उन्हें AI के आउटपुट की गुणवत्ता पसंद थी, लेकिन टूल स्वयं अनाड़ी था और इसमें स्पष्ट फीचर गायब थे। वे अपनी टीम के साथ साझा करने के लिए सामग्री को Google Docs में कॉपी कर रहे थे, मैन्युअल रूप से ट्रैक कर रहे थे कि उन्होंने क्या उत्पन्न किया था, कंटेंट आइडिया की स्प्रेडशीट रख रहे थे क्योंकि मेरे प्रोडक्ट ने उस वर्कफ़्लो को संभाला नहीं था।
वह बनाना जो लोग वास्तव में चाहते हैं
उस फीडबैक सेशन ने सब कुछ बदल दिया। मैंने भव्य विज़न पर काम करना बंद कर दिया और उन उबाऊ समस्याओं को ठीक करना शुरू कर दिया जिनसे मेरे वास्तविक उपयोगकर्ता हर दिन जूझ रहे थे। बेहतर फ़ाइल ऑर्गनाइज़ेशन, टीम सहयोग, कंटेंट कैलेंडर, उपयोग विश्लेषण जो समझ में आता हो। सेक्सी फीचर नहीं, AI सफलताएँ नहीं, बस ठोस प्रोडक्ट डेवलपमेंट जिसने लोगों के जीवन को थोड़ा आसान बनाया।
तकनीकी काम कम दिलचस्प लेकिन अधिक महत्वपूर्ण था। उचित उपयोगकर्ता प्रमाणीकरण बनाना, फ़ाइल साझाकरण लागू करना, डैशबोर्ड व्यू बनाना जो तीन सेकंड से कम में लोड होते थे। मैंने AI मॉडल को ट्रेन करने की तुलना में डेटाबेस क्वेरी को ऑप्टिमाइज़ करने में अधिक समय बिताया, प्रॉम्प्ट इंजीनियरिंग सफलताओं की तुलना में UX सुधारों पर अधिक समय बिताया।
राजस्व महीने-दर-महीने लगातार बढ़ता गया। अभी भी Uber छोड़ने के लिए पर्याप्त नहीं, लेकिन यह सोचना शुरू करने के लिए पर्याप्त है कि वह संक्रमण कैसा दिख सकता है। मेरे उपयोगकर्ता बने रहे, उच्च स्तरों पर अपग्रेड कर रहे थे, सहकर्मियों को रेफर कर रहे थे। प्रोडक्ट केवल तकनीकी रूप से चतुर होने के बजाय वास्तव में उपयोगी बन रहा था।
आगे लंबी सड़क
मैं अभी भी Uber चला रहा हूँ, अभी भी राइड्स के बीच AI प्रोडक्ट बना रहा हूँ, अभी भी Vancouver भर के पार्किंग लॉट में डिप्लॉयमेंट की समस्याओं को डीबग कर रहा हूँ। लेकिन कुछ बदल गया है। यह अब सिर्फ एक साइड हसल नहीं है — यह एक वास्तविक व्यवसाय बन रहा है, धीरे-धीरे और गंदे तरीके से और उन तरीकों से जिनकी मैंने कभी उम्मीद नहीं की थी।
AI इकोसिस्टम अभी भी मेरे रहने से तेज़ चल रहा है। नए मॉडल, नई क्षमताएँ, हर हफ्ते लॉन्च हो रहे नए प्रतियोगी। लेकिन मैं यह समझने लगा हूँ कि सफलता सबसे उन्नत AI या सबसे नवीन फीचर होने के बारे में नहीं है। यह वास्तविक लोगों के लिए वास्तविक समस्याओं को हल करने के बारे में है, लगातार और विश्वसनीय रूप से, भले ही आपका डेवलपमेंट एनवायरनमेंट 2018 Honda Civic की फ्रंट सीट ही क्यों न हो।
अभी भी एक लंबा रास्ता तय करना है। मेरे रात की ड्राइविंग बंद करने से पहले राजस्व में काफी वृद्धि होनी चाहिए। प्रोडक्ट रोडमैप उन फीचर्स से भरा है जो पीछे मुड़कर देखने पर स्पष्ट लगते हैं लेकिन विकास के हफ्तों की आवश्यकता होती है जिसे मैं नींद और सामाजिक जीवन से चुरा रहा हूँ। प्रतिस्पर्धा बढ़ रही है, और VC-फंडेड स्टार्टअप अनुभवी डेवलपर्स और मार्केटिंग बजट वाली टीमों के साथ समान उपकरण बना रहे हैं जो मेरी वार्षिक आय को बौना कर देते हैं।
लेकिन मैं अभी भी यहाँ हूँ, अभी भी बना रहा हूँ, अभी भी आश्वस्त हूँ कि अपनी कार से AI कंपनी को बूटस्ट्रैप करना किसी तरह एक व्यवहार्य करियर पथ है। हो सकता है कि मैं भ्रामक हूँ। हो सकता है कि यह पूरा प्रयोग शानदार ढंग से विफल हो जाए और मैं अगले पाँच सालों तक Uber चलाता रहूँ। या हो सकता है, बस हो सकता है, कि मैं यह पता लगा लूँ कि देर रात के कोडिंग सेशन और ग्राहक बातचीत को एक वास्तविक व्यवसाय जैसी किसी चीज़ में कैसे बदला जाए। किसी भी तरह, मैं हर गलती, हर छोटी जीत, हर उस पल का दस्तावेजीकरण करूँगा जब मैंने सवाल किया कि क्या इनमें से कुछ भी समझ में आता है। क्योंकि अगर एक चीज़ मैंने Uber राइड्स के बीच AI प्रोडक्ट बनाने से सीखी है, तो वह यह है कि यात्रा किसी भी ऐसे परिणाम से अधिक अजीब और शिक्षाप्रद है जिसकी मैं योजना बना सकता था।
Costruire Prodotti AI Tra le Corse Uber: Il Mio Diario Delirante da Sviluppatore
È passata mezzanotte e sono seduto nella mia Honda Civic fuori da un negozio di bubble tea sulla Commercial Drive, mentre guardo la batteria del mio laptop morire lentamente mentre debuggo il più imbarazzante fallimento di integrazione API della mia vita. Gli studenti universitari ubriachi che ho lasciato cinque minuti fa hanno pagato in contanti e sono inciampati verso quello che presumo fosse il loro dormitorio, lasciandomi solo con i miei pensieri e un codebase che è più spaghetti che software. Questa è la mia vita ora: autista Uber a Vancouver di notte, aspirante imprenditore AI durante le pause del surge pricing.
Sei mesi fa, avevo zero esperienza in AI e una laurea in Informatica che non stavo usando. Ora ho tre prodotti AI a metà, un GitHub pieno di repository abbandonati e abbastanza email di rifiuto da parte di investitori per tappezzare il mio monolocale a Burnaby. Ma sono ancora qui, ancora a costruire, ancora a convincermi che il prossimo deploy sarà quello che cambierà tutto.
La Verità Che Nessuno Racconta
Tutti su Twitter fanno sembrare lo sviluppo AI indipendente affascinante. Pubblica uno screenshot della tua dashboard delle entrate, condividi qualche citazione ispiratrice sul costruire in pubblico, guarda i like arrivare. La realtà è più brutta. Sto costruendo prodotti nei parcheggi di Tim Hortons alle 3 di notte perché è allora che i turisti smettono di richiedere corse e ho finalmente tempo per programmare.
La mia configurazione attuale è patetica: MacBook Pro 2019 con schermo rotto, hotspot del telefono per internet che si interrompe ogni volta che passa un autobus, e un sedile dell'auto che non è stato progettato per umani che passano otto ore a fare debug di script Python. La mia schiena è permanentemente storta dallo stare curvo sul laptop in spazi angusti, e ho memorizzato ogni caffè aperto 24 ore tra downtown e Richmond perché sono gli unici posti con WiFi affidabile e bagni.
L'ecosistema di sviluppo AI si muove così velocemente che qualsiasi tutorial che aggiungo ai segnalibri è obsoleto prima ancora di finire di leggerlo. OpenAI rilascia un nuovo modello, Anthropic aggiorna la loro API, Google annuncia qualcosa che rende potenzialmente irrilevante tutto ciò su cui sto lavorando. Ricostruisco costantemente le stesse funzionalità perché la tecnologia sottostante è cambiata mentre stavo portando a casa ubriachi da Granville Street.
Prodotto Uno: Il Disastro dell'Apprendimento Linguistico
Il mio primo prodotto AI doveva rivoluzionare l'apprendimento delle lingue per gli immigrati a Vancouver. Perché niente dice "capire il tuo mercato" come un tizio che parla solo inglese che costruisce strumenti linguistici per persone che imparano l'inglese, giusto?
Il concetto sembrava solido: un tutor AI che aiutava i nuovi arrivati a praticare l'inglese usando scenari specifici di Vancouver. Ordinare un caffè da JJ Bean, chiedere indicazioni per VCC, gestire una conversazione con un padrone di casa sulle bollette di BC Hydro. Situazioni reali che avrebbero effettivamente incontrato, alimentato da GPT-4 con prompt personalizzati che comprendevano il contesto locale.
Ho passato tre settimane a costruire questa cosa tra una corsa e l'altra. Parcheggiato fuori YVR in attesa di corse per l'aeroporto, programmando flussi di conversazione. Seduto al McDonald's sulla Robson alle 2 di notte, addestrando l'AI sul gergo di Vancouver e sui riferimenti locali. L'app poteva generare dialoghi realistici su qualsiasi cosa, dai ritardi dello SkyTrain alla spiegazione della differenza tra Vancouver e North Vancouver ai turisti confusi.
L'implementazione tecnica era un pasticcio. Parlo di gestione dello stato tenuta insieme da preghiere, uno schema di database che aveva senso alle 4 del mattino ma sembrava arte astratta durante le sessioni di debug diurne. Le risposte dell'AI erano inconsistenti — a volte brillanti, a volte raccomandavano agli utenti di praticare l'inglese chiedendo a sconosciuti "le belle montagne di Regina" o suggerendo di prendere la "metropolitana di Toronto per Stanley Park."
Il giorno del lancio arrivò. Ho postato su Reddit, condiviso in alcuni gruppi Facebook per nuovi arrivati, ho persino convinto qualche passeggero a provarlo. Il feedback è stato... istruttivo. A quanto pare, le persone che imparano l'inglese non vogliono fare pratica con un AI che occasionalmente dimentica in quale città dovrebbe aiutarle a orientarsi. Un utente ha lasciato una recensione che mi perseguita ancora: "L'app mi ha detto di esercitarmi a ordinare 'pizza alla Vancouver.' L'ho chiesto in tre posti. Nessuno sa cosa significa. Nemmeno l'app."
Utenti totali dopo due mesi: adozione minima. Lezioni apprese: forse capisci il tuo mercato di riferimento prima di costruire soluzioni per loro.
Pivotare in un Parcheggio
Il fallimento di un prodotto è diverso quando lo costruisci tra le corse Uber. Non c'è riunione di squadra per discutere i prossimi passi, nessuna sessione di brainstorming per pensare a pivot. Solo io, seduto fuori dal Cactus Club all'1 di notte, a fissare Google Analytics che mostra zero utenti attivi, cercando di capire cosa sia andato storto mentre controllo le richieste di corse.
Il pivot è arrivato durante un martedì sera particolarmente lento. Ero parcheggiato fuori da un hotel in centro, guardando le metriche di coinvolgimento della mia app per l'apprendimento delle lingue appiattirsi, quando ho sentito due passeggeri parlare di quanto fosse impossibile trovare buoni content creator per il blog della loro startup. Avevano bisogno di contenuti tecnici, li volevano veloci, ed erano disposti a pagare bene per una scrittura di qualità.
Momento lampadina: e se costruissi un assistente di scrittura AI specifico per contenuti tecnici? Non un altro strumento generico di scrittura AI, ma qualcosa costruito appositamente per aziende SaaS, startup, sviluppatori — persone che avevano bisogno di contenuti che non sembrassero scritti da un robot che cerca di colpire obiettivi SEO.
Ho iniziato a costruire quella notte. Nuovo repo GitHub, nuova visione di prodotto, stesso laptop con schermo rotto e postura terribile. Questa volta sono stato più intelligente sull'architettura — o almeno così pensavo. Design API più pulito, struttura del database migliore, prompt engineering più ponderato. L'AI poteva scrivere post tecnici per blog, documentazione API, descrizioni di prodotti, persino commenti nel codice che non sembravano generati da un generatore di numeri casuali particolarmente verboso.
L'Incubo Tecnico Che Nessuno Ti Avverte
Costruire prodotti AI come sviluppatore solitario è come essere un'orchestra di una persona in cui metà degli strumenti sono in fiamme e lo spartito continua a cambiare a metà esecuzione. Ogni integrazione si rompe in modo diverso. Ogni API ha il suo modo speciale di fallire catastroficamente.
L'API di OpenAI iniziava casualmente a restituire risposte in quella che penso fosse portoghese, ma solo per certi tipi di prompt, solo il martedì, solo quando Mercurio era retrogrado. Claude di Anthropic funzionava perfettamente per settimane, poi improvvisamente sviluppava forti opinioni sul non scrivere copie di marketing perché potrebbe essere "manipolativo." Ho passato più tempo a gestire stranezze API che a costruire funzionalità reali.
I database vettoriali sono l'inferno speciale riservato agli sviluppatori indipendenti che pensavano che memorizzare embedding sarebbe stato semplice. Pinecone funzionava alla grande finché non funzionava più. Weaviate aveva una documentazione bellissima che non somigliava a come nulla funzionasse effettivamente. Ho provato a costruire la mia soluzione di storage vettoriale e ho imparato perché è una cattiva idea più o meno quando il mio laptop ha iniziato a fare rumori preoccupanti durante le operazioni di indicizzazione.
I costi dell'infrastruttura mi stavano mangiando vivo. Ogni esperimento, ogni test, ogni volta che dimenticavo di aggiungere un rate limiting adeguato — soldi che volavano via dal mio account AWS più velocemente di quanto potessi guadagnarli guidando per il pubblico notturno di Vancouver. Ho ottimizzato tutto ciò a cui potevo pensare: modelli più piccoli per compiti semplici, caching delle risposte, prompt engineering aggressivo per ridurre l'uso di token. Bruciavo comunque soldi in costi di calcolo mentre le mie entrate reali rimanevano ostinatamente a zero.
Trovare Utenti in Posti Inaspettati
Fare marketing per un prodotto AI dalla tua auto è surreale. Pubblico screenshot su Twitter mentre aspetto ai semafori rossi, rispondo ai commenti su Hacker News tra una raccolta passeggeri e l'altra, cerco di costruire un pubblico di potenziali clienti mentre il mio lavoro principale comporta portare in giro persone che non hanno idea che io sia un imprenditore tecnologico part-time.
La svolta è arrivata da una fonte inaspettata: i miei passeggeri Uber. Ho iniziato a menzionare il mio strumento di scrittura AI a chiunque sembrasse lavorare nel tech. La scena startup di Vancouver è sorprendentemente piccola, e a quanto pare tutti conoscono tutti gli altri. Una data scientist che ho portato da uno spazio di coworking in centro a YVR ha provato il mio strumento e lo ha adorato. Mi ha presentato al team di marketing della sua startup. Sono diventati i miei primi clienti paganti.
Il passaparola si è diffuso organicamente attraverso la comunità tech di Vancouver. Conversazioni al bar, eventi di networking a cui non potevo partecipare perché stavo guidando, gruppi Slack in cui i miei primi utenti condividevano il mio strumento con i loro colleghi. Non stavo scalando attraverso canali di marketing tradizionali — stavo crescendo attraverso la strana intersezione tra ride-sharing e networking tecnologico che esiste solo in città come Vancouver dove tutti sono connessi da circa due gradi di separazione.
Le entrate hanno iniziato a entrare: importi modesti il primo mese, crescendo costantemente nei mesi successivi. Non soldi che cambiano la vita, ma abbastanza per coprire le mie bollette AWS e comprare caffè migliore per quelle sessioni di debug alle 3 del mattino. Ancora più importante, le persone stavano effettivamente usando ciò che avevo costruito. L'AI generava contenuti che aziende reali stavano pubblicando, contenuti che non sembravano provenire da una content mill o da una fabbrica di keyword stuffing.
La Trappola della Validazione
Il successo è pericoloso quando costruisci da solo. Quel primo assaggio di entrate, quelle prime recensioni positive degli utenti, la soddisfazione di vedere il tuo codice risolvere problemi reali — è inebriante. Ho iniziato a pensare di aver capito tutto, di aver decifrato il codice dello sviluppo di prodotti AI mentre ero seduto nella mia Honda Civic.
Sono diventato arrogante. Ho iniziato a pianificare il Prodotto Tre prima di aver scalato adeguatamente il Prodotto Due. Ho iniziato a abbozzare un ambizioso sistema di gestione dei contenuti AI che avrebbe rivoluzionato il modo in cui le piccole imprese gestivano l'intero pipeline dei contenuti. Lo scope creep era reale ed era spettacolare.
Nel frattempo, i miei utenti esistenti chiedevano funzionalità di base che non avevo costruito: migliore organizzazione dei contenuti, strumenti di collaborazione, integrazioni con le piattaforme che usavano realmente. Invece di ascoltare, stavo inseguendo la prossima funzionalità AI brillante, cercando di costruire qualcosa di tecnicamente impressionante piuttosto che qualcosa di genuinamente utile.
La sveglia è arrivata durante una conversazione particolarmente onesta con il mio cliente più grande, una startup che mi pagava significativamente per la loro generazione di contenuti. Amavano la qualità dell'output dell'AI, ma lo strumento stesso era goffo e mancava di funzionalità ovvie. Copiavano i contenuti in Google Docs per condividerli con il loro team, tracciavano manualmente ciò che avevano generato, tenevano fogli di calcolo delle idee per i contenuti perché il mio prodotto non gestiva nessuno di quei flussi di lavoro.
Costruire Ciò Che La Gente Vuole Davvero
Quella sessione di feedback ha cambiato tutto. Ho smesso di lavorare alla grande visione e ho iniziato a risolvere i problemi noiosi che i miei utenti reali affrontavano ogni giorno. Migliore organizzazione dei file, collaborazione di squadra, calendari dei contenuti, analytics di utilizzo che avevano senso. Non funzionalità sexy, non scoperte AI, solo solido sviluppo di prodotto che rendeva la vita delle persone leggermente più facile.
Il lavoro tecnico era meno interessante ma più importante. Costruire autenticazione utente adeguata, implementare la condivisione di file, creare viste dashboard che si caricavano in meno di tre secondi. Ho passato più tempo a ottimizzare le query del database che ad addestrare modelli AI, più tempo su miglioramenti UX che su scoperte di prompt engineering.
Le entrate sono cresciute costantemente mese dopo mese. Ancora non abbastanza per lasciare Uber, ma abbastanza per iniziare a pensare a come potrebbe essere quella transizione. I miei utenti restavano, passavano a livelli superiori, raccomandavano il prodotto ai colleghi. Il prodotto stava diventando genuinamente utile piuttosto che solo tecnicamente intelligente.
La Lunga Strada Davanti
Faccio ancora l'autista Uber, costruisco ancora prodotti AI tra le corse, debuggo ancora problemi di deploy nei parcheggi di Vancouver. Ma qualcosa è cambiato. Questo non è più solo un side hustle — sta diventando un vero business, lentamente e disordinatamente e in modi che non mi aspettavo.
L'ecosistema AI si muove ancora più velocemente di quanto io possa tenere il passo. Nuovi modelli, nuove capacità, nuovi concorrenti che lanciano ogni settimana. Ma sto iniziando a capire che il successo non riguarda l'avere l'AI più avanzata o le funzionalità più innovative. Riguarda il risolvere problemi reali per persone reali, in modo coerente e affidabile, anche se il tuo ambiente di sviluppo è il sedile anteriore di una Honda Civic del 2018.
C'è ancora molta strada da fare. Le entrate devono crescere sostanzialmente prima che io possa smettere di guidare di notte. La roadmap del prodotto è piena di funzionalità che sembrano ovvie in retrospettiva ma richiedono settimane di tempo di sviluppo che sto rubando al sonno e alla vita sociale. La concorrenza sta aumentando, e startup finanziate da VC stanno costruendo strumenti simili con team di sviluppatori esperti e budget di marketing che fanno impallidire il mio reddito annuale.
Ma sono ancora qui, ancora a costruire, ancora convinto che avviare un'azienda AI dalla tua auto sia in qualche modo un percorso di carriera valido. Forse sono delirante. Forse tutto questo esperimento finirà in modo spettacolare e farò l'autista Uber per i prossimi cinque anni. O forse, solo forse, riuscirò a trasformare sessioni di programmazione notturne e conversazioni con i clienti in qualcosa che assomigli a un vero business. In ogni caso, documenterò ogni errore, ogni piccola vittoria, ogni momento in cui mi chiedo se tutto questo abbia senso. Perché se c'è una cosa che ho imparato costruendo prodotti AI tra le corse Uber, è che il viaggio è più strano e più educativo di qualsiasi risultato avrei potuto pianificare.
Uberの合間にAIプロダクトを開発する:妄想に満ちた開発者日記
深夜0時を過ぎている。私はCommercial Drive沿いのタピオカティーショップの外に停めたHonda Civicの中で、ラップトップのバッテリーがゆっくりと切れていくのを眺めながら、人生で最も恥ずかしいAPI連携の障害をデバッグしている。5分前に降ろした酔っ払った大学生たちは現金を払い、おそらく彼らの寮だろう建物によろめきながら消えていった。私には、自身の思考と、ソフトウェアというよりスパゲッティのようなコードベースだけが残された。これが今の私の人生だ。夜はVancouverのUberドライバー、そして需要が落ち着く合間にはAI起業家への道を夢見る者。
6ヶ月前、私はAIの経験がゼロで、使われていないコンピュータサイエンスの学位を持っていた。今では、中途半端なAIプロダクトが3つ、放棄されたリポジトリで埋まったGitHub、そしてBurnabyのスタジオアパートの壁を飾るのに十分な数の投資家からの rejection メールを抱えている。しかし、私はまだここにいる。まだ作り続けている。次のデプロイこそが全てを変えると、自分に言い聞かせながら。
誰も語らない現実
Twitterでは誰もがインディーAI開発を魅力的に見せている。収益ダッシュボードのスクリーンショットを投稿し、公開開発についてのインスピレーションあふれる名言を共有し、いいねが集まるのを眺める。現実はもっと醜い。私は午前3時にTim Hortonsの駐車場でプロダクトを開発している。なぜなら、その時間になると観光客が乗車リクエストをしなくなり、実際にコードを書く時間ができるからだ。
現在の私のセットアップは哀れなものだ。画面にひびが入った2019年製MacBook Pro、バスが通るたびに接続が切れるスマホのテザリング、そして人間が8時間もPythonスクリプトのデバッグに費やすように設計されていない車のシート。狭い空間でラップトップにうつむく姿勢が常なので、背中は永久に歪んでいる。ダウンタウンからRichmondまでの間にある24時間営業のコーヒーショップは、信頼できるWiFiとトイレがある唯一の場所なので、全てを暗記してしまった。
AI開発のエコシステムは非常に速く動いているため、ブックマークしたチュートリアルは読み終える前に時代遅れになる。OpenAIが新しいモデルをリリースし、AnthropicがAPIを更新し、Googleが私が取り組んでいる全てを無意味にする可能性のある何かを発表する。Granville Streetから酔っ払った人々を家まで運転している間に基盤技術が変わってしまい、同じ機能を絶えず作り直している。
プロダクトその1:言語学習の大失敗
私の最初のAIプロダクトは、Vancouverの移民向け言語学習に革命を起こすはずだった。英語しか話せない人間が、英語を学ぶ人々のために言語ツールを構築する。これほど「市場を理解している」と言えることはあるだろうか?
コンセプトは堅実に思えた。Vancouver特有のシナリオを使って新参者が英語を練習できるAIチューターだ。JJ Beanでコーヒーを注文する、VCCへの道順を尋ねる、BC Hydroの請求書について大家と会話する。彼らが実際に直面する現実の場面を、地域の文脈を理解したカスタムプロンプトを備えたGPT-4で動かす。
私は、乗車の合間にこのツールを3週間かけて構築した。YVRで空港利用客を待つ間に駐車し、会話の流れをコーディングした。午前2時にRobson通りのマクドナルドに座り、AIにVancouverのスラングや現地の言い回しを学習させた。このアプリは、SkyTrainの遅延から、VancouverとNorth Vancouverの違いを混乱した観光客に説明することまで、あらゆるリアルな対話を生成できた。
技術的な実装はめちゃくちゃだった。祈りでつながれた状態管理、午前4時には意味が通っていたものの、昼間のデバッグ中には抽象芸術のように見えたデータベーススキーマ。AIの応答は一貫性がなかった。素晴らしいこともあれば、「美しいReginaの山々」について見知らぬ人に尋ねる練習を勧めたり、「Stanley ParkへTorontoの地下鉄」に乗るよう提案したりすることもあった。
ローンチの日が来た。Redditに投稿し、新参者向けのFacebookグループで共有し、何人かの乗客にも試してもらった。フィードバックは... 勉強になった。英語を学びたい人々は、どの街をナビゲートするのかを時々忘れてしまうAIと練習したくないことが判明した。あるユーザーから今でも心に残るレビューが届いた。「アプリが『Vancouver風ピザ』を注文する練習をするよう言ってきた。3軒で尋ねたが、誰もそれが何か知らなかった。アプリも知らない。」
2ヶ月後の総ユーザー数:最小限の普及。学んだ教訓:解決策を構築する前に、ターゲット市場を理解すべきかもしれない。
駐車場でのピボット
Uberの合間に開発していると、プロダクトの失敗の意味合いが異なる。次のステップを話し合うチームミーティングも、ピボットをブレインストーミングするホワイトボードセッションもない。ただ私だけが、午前1時にCactus Clubの外に座り、アクティブユーザーゼロを示すGoogle Analyticsを睨みながら、何が悪かったのかを考えつつ、乗車リクエストを監視している。
転機は、特に暇な火曜の夜に訪れた。ダウンタウンのホテルの外に停車し、言語学習アプリのエンゲージメント指標が横ばいで推移するのを眺めていると、2人の乗客が、自分たちのスタートアップのブログに優れたコンテンツクリエイターを見つけるのがどれほど不可能かについて話しているのが聞こえた。彼らは技術的なコンテンツを必要としており、すぐに必要で、質の高い文章に対して惜しみなくお金を払うつもりだった。
ひらめきの瞬間:技術コンテンツに特化したAIライティングアシスタントを構築したらどうか? また別の汎用的なAIライティングツールではなく、SaaS企業、スタートアップ、開発者——SEOのキーワードターゲットに当てはめようとするロボットが書いたようには聞こえないコンテンツを必要とする人々——のために特別に作られたものだ。
その夜、私は構築を始めた。新しいGitHubリポジトリ、新しいプロダクトビジョン、同じひび割れたラップトップの画面とひどい姿勢。今回はアーキテクチャについて賢くなっていた——少なくともそう思っていた。よりクリーンなAPI設計、より良いデータベース構造、より思慮深いプロンプトエンジニアリング。AIは、技術的なブログ記事、APIドキュメント、プロダクト説明、さらには特に冗長な乱数生成器によって生成されたようには聞こえないコードコメントを書くことができた。
誰も警告してくれない技術的な悪夢
ソロ開発者としてAIプロダクトを構築することは、楽器の半分が燃えていて、楽譜が演奏中に絶えず変わるような、一人オーケストラのようなものだ。全ての連携はそれぞれ異なる方法で壊れる。全てのAPIには、それぞれ独自の壊滅的な失敗の仕方がある。
OpenAIのAPIは、特定のプロンプトタイプ、特定の曜日(火曜日)、水星が逆行している時に限り、ポルトガル語と思われる応答をランダムに返し始めた。AnthropicのClaudeは何週間も完璧に動作した後、突然、マーケティングコピーを書くことは「操作的」かもしれないという強い意見を持ち始めた。私は実際の機能を構築するよりも、APIの癖に対処する方により多くの時間を費やしていた。
ベクターデータベースは、埋め込みの保存が簡単だと思っていたインディー開発者のための特別な地獄だ。Pineconeはうまく機能していたが、ある日突然機能しなくなった。Weaviateは美しいドキュメントがあったが、実際の動作とは全く関係がなかった。私は独自のベクターストレージソリューションを構築しようと試み、ラップトップがインデックス処理中に気になる音を発し始めた頃に、それが悪いアイデアである理由を学んだ。
インフラストラクチャのコストが私を蝕んでいた。全ての実験、全てのテスト、適切なレート制限を設定し忘れるたびに、Vancouverの深夜の乗客を運んで稼ぐよりも速く、私のAWSアカウントからお金が飛び去っていった。考えられる限りの最適化を行った:単純なタスクには小さなモデル、レスポンスキャッシング、トークン使用量を減らすための攻撃的なプロンプトエンジニアリング。それでも、実際の収益は頑なにゼロのまま、計算コストに金を費やし続けていた。
予期せぬ場所でのユーザー発見
車からAIプロダクトをマーケティングするのは非現実的だ。赤信号で待っている間にTwitterにスクリーンショットを投稿し、乗客の迎車の合間にHacker Newsのコメントに返信し、潜在顧客のオーディエンスを構築しようと努める一方で、本業はテック起業家として副業をしているとは露知らずの人々を運転することだ。
突破口は予期せぬ源からもたらされた:私のUberの乗客たちだ。私は技術系で働いているように見える人には誰にでも、自分のAIライティングツールの話をし始めた。Vancouverのスタートアップシーンは驚くほど小さく、どうやら誰もが互いを知っているようだ。ダウンタウンのコワーキングスペースからYVRまで私が運転したデータサイエンティストが、私のツールを試して気に入った。彼女は私を自身のスタートアップのマーケティングチームに紹介した。彼らが私の最初の有料顧客となった。
口コミはVancouverのテックコミュニティを通じて自然に広がった。コーヒーショップでの会話、参加したくても運転していたために参加できなかったネットワーキングイベント、初期のユーザーが同僚とツールを共有したSlackグループ。私は従来のマーケティングチャネルを通じてスケールしていたわけではない。—— 誰もが2つの隔たりでつながっているVancouverのような都市にしか存在しない、ライドシェアリングとテックネットワーキングの奇妙な交差点を通じて成長していた。
収益が少しずつ入り始めた。最初の月は控えめな額で、その後数ヶ月で着実に増加した。生活を変えるような金額ではないが、AWSの請求額をカバーし、午前3時のデバッグセッションに向けてより良いコーヒーを買うには十分だった。さらに重要なことに、人々が実際に私が構築したものを使っていたのだ。AIは、実際の企業が公開しているコンテンツ、コンテンツファクトリーやキーワード詰め込み工場から来たようには聞こえないコンテンツを生成していた。
承認の罠
ソロで開発していると、成功は危険だ。あの最初の収益の味、あの初期の肯定的なユーザーレビュー、自分のコードが実際に現実の問題を解決しているのを見る満足感——それは酔わせるものだ。私は全てを理解した、Honda Civicに座りながらAIプロダクト開発の秘訣を突き止めたと思い始めた。
私は傲慢になった。プロダクト2を適切にスケールさせる前に、プロダクト3を計画し始めた。中小企業がコンテンツパイプライン全体を扱う方法に革命を起こすであろう、野心的なAI搭載コンテンツ管理システムのスケッチを描き始めた。スコープクリープは本物で、それは壮観だった。
その間、既存のユーザーは私が構築していない基本的な機能を求めていた:より良いコンテンツ整理、コラボレーションツール、彼らが実際に使っているプラットフォームとの連携。耳を傾ける代わりに、私は次の輝くAI機能を追いかけ、真に役立つものではなく、技術的に印象的なものを構築しようとしていた。
目覚めの電話は、私の最大の顧客——コンテンツ生成にそれなりの対価を支払ってくれているあるスタートアップ——との特に正直な会話の中で訪れた。彼らはAIのアウトプットの質を気に入っていたが、ツール自体はぎこちなく、明らかな機能が欠けていた。彼らはチームと共有するためにコンテンツをGoogle Docsにコピーし、生成したものを手動で追跡し、私のプロダクトがそのワークフローを全く処理しなかったため、コンテンツアイデアのスプレッドシートを保持していた。
人々が実際に欲しいものを作る
そのフィードバックセッションが全てを変えた。私は壮大なビジョンに取り組むのをやめ、実際のユーザーが毎日直面している退屈な問題を修正し始めた。より良いファイル整理、チームコラボレーション、コンテンツカレンダー、意味のある使用状況分析。セクシーな機能でも、AIのブレークスルーでもなく、人々の生活をほんの少し楽にする堅実なプロダクト開発だけだ。
技術的な作業は面白くなくなったが、より重要になった。適切なユーザー認証の構築、ファイル共有の実装、3秒以内に読み込まれるダッシュボードビューの作成。AIモデルのトレーニングよりもデータベースクエリの最適化に、プロンプトエンジニアリングのブレークスルーよりもUXの改善により多くの時間を費やした。
収益は月ごとに着実に成長した。Uberを辞めるにはまだ不十分だが、その移行がどのようなものかを考え始めるには十分だった。ユーザーは定着し、上位ティアにアップグレードし、同僚を紹介してくれた。プロダクトは、技術的に巧妙であるだけでなく、真に役立つものになりつつあった。
長い道のり
私は今もUberを運転し、乗車の合間にAIプロダクトを構築し、Vancouver中の駐車場でデプロイメントの問題をデバッグしている。しかし、何かが変わった。これはもはや単なる副業ではない——ゆっくりと、散らかりながら、予期せぬ方法で、本物のビジネスになりつつある。
AIエコシステムは、私が追いつける速度よりも速く動き続けている。新しいモデル、新しい機能、新しい競合他社が毎週立ち上げられている。しかし、成功とは最も先進的なAIや最も革新的な機能を持つことではないと、私は理解し始めている。開発環境が2018年式Honda Civicの助手席であっても、実際の人々のために実際の問題を、一貫して、信頼性高く解決することなのだ。
まだ長い道のりがある。夜の運転をやめるには、収益を大幅に伸ばす必要がある。プロダクトのロードマップは、振り返ってみれば明白に思えるが、睡眠や社会生活から奪った開発時間を何週間も必要とする機能でいっぱいだ。競争は激化しており、VCから資金提供を受けたスタートアップが、経験豊富な開発者のチームと私の年間収入をはるかに上回るマーケティング予算で同様のツールを構築している。
しかし、私はまだここにいる。まだ作り続けている。車からAI会社をブートストラップすることが、どういうわけか実行可能なキャリアパスであると確信している。私は妄想的なのかもしれない。この実験全体が派手に失敗し、今後5年間Uberを運転し続けることになるかもしれない。あるいは、ひょっとすると、深夜のコーディングセッションと顧客との会話を、本物のビジネスに似た何かに変える方法を見つけるかもしれない。どちらにせよ、私は全ての間違い、小さな勝利、そしてこれが全て意味を成すのか疑問に思う瞬間を記録し続けるつもりだ。なぜなら、Uberの合間にAIプロダクトを構築して学んだことが一つあるとすれば、それは、その旅路が、私が計画できたであろうどの結果よりも奇妙で、そして教育的であるということだからだ。
우버 운전 틈에 AI 제품 만들기: 망상 어린 개발자 일기
자정이 지났습니다. 저는 Commercial Drive에 있는 버블티 가게 앞에 세운 제 Honda Civic 안에 앉아, 노트북 배터리가 천천히 닳아가는 모습을 지켜보며 제 인생에서 가장 부끄러운 API 통합 실패를 디버깅하고 있습니다. 5분 전에 내려준 취한 대학생들은 현금을 건네주고 비틀거리며 기숙사로 보이는 곳으로 걸어갔고, 저는 제 생각과 스파게티보다 더 엉망인 코드베이스만 남았습니다. 이게 제 인생입니다: 밤에는 Vancouver 우버 기사, 서지 가격이 오르는 동안에는 AI 창업가 지망생.
6개월 전, 저는 AI 경험이 전혀 없었고 사용하지 않던 컴퓨터 공학 학위만 있었습니다. 지금은 세 개의 반쯤 완성된 AI 제품, 버려진 저장소로 가득한 GitHub, 그리고 Burnaby에 있는 제 원룸을 도배할 만큼의 투자자 거절 메일을 가지고 있습니다. 하지만 저는 여전히 여기 있고, 여전히 만들고 있으며, 다음 배포가 모든 것을 바꿀 것이라고 스스로를 설득하고 있습니다.
아무도 말하지 않는 현실 점검
트위터의 모든 사람들은 인디 AI 개발이 화려해 보이게 만듭니다. 수익 대시보드 스크린샷을 올리고, 공개적으로 빌드하는 것에 대한 영감을 주는 인용구를 공유하고, 좋아요가 쌓이는 것을 지켜보세요. 현실은 더 추합니다. 저는 새벽 3시에 Tim Hortons 주차장에서 제품을 만들고 있습니다. 그 시간이 되면 관광객들이 승차 요청을 멈추고 제가 실제로 코딩할 시간이 생기기 때문입니다.
현재 제 설정은 한심합니다: 화면이 깨진 2019 MacBook Pro, 버스가 지나갈 때마다 끊기는 휴대폰 핫스팟 인터넷, 그리고 인간이 8시간 동안 Python 스크립트를 디버깅하도록 설계되지 않은 차량 시트. 좁은 공간에서 노트북에 구부정하게 매달린 탓에 제 등은 영구적으로 꼬였고, 다운타운과 Richmond 사이의 24시간 커피숍을 모두 외웠습니다. 거기에만 믿을 수 있는 WiFi와 화장실이 있기 때문입니다.
AI 개발 생태계는 너무 빨리 움직여서 제가 북마크한 어떤 튜토리얼도 다 읽기도 전에 쓸모없어집니다. OpenAI는 새 모델을 출시하고, Anthropic은 API를 업데이트하고, Google은 제가 작업 중인 모든 것을 잠재적으로 무의미하게 만들 무언가를 발표합니다. 기반 기술이 제가 Granville Street에서 취한 사람들을 집에 데려다주는 동안 바뀌었기 때문에 저는 끊임없이 같은 기능을 다시 구축하고 있습니다.
제품 1: 언어 학습 참사
제 첫 번째 AI 제품은 Vancouver에 있는 이민자들을 위한 언어 학습에 혁명을 일으킬 예정이었습니다. "시장을 이해한다"는 것은 영어만 하는 사람이 영어를 배우는 사람들을 위해 언어 도구를 만드는 것과 같은 말이겠죠, 그렇죠?
개념은 탄탄해 보였습니다: 새내기들이 Vancouver 특화 시나리오를 사용해 영어를 연습하도록 돕는 AI 튜터. JJ Bean에서 커피 주문하기, VCC에 가는 길 묻기, BC Hydro 청구서에 대해 집주인과 대화하기. GPT-4로 구동되고 지역 맥락을 이해하는 맞춤 프롬프트를 사용해 그들이 실제로 마주칠 실제 상황들.
저는 승차 사이에 이걸 만드는 데 3주를 보냈습니다. 공항 픽업을 기다리며 YVR 밖에 주차하고, 대화 흐름을 코딩했습니다. 새벽 2시에 Robson에 있는 McDonald's에 앉아, AI에 Vancouver 은어와 지역 참고 자료를 훈련시켰습니다. 앱은 SkyTrain 지연부터 혼란스러운 관광객에게 Vancouver와 North Vancouver의 차이를 설명하는 것까지 현실적인 대화를 생성할 수 있었습니다.
기술 구현은 엉망이었습니다. 기도로 유지되는 상태 관리, 새벽 4시에는 말이 되지만 낮 디버깅 세션 중에는 추상 미술처럼 보이는 데이터베이스 스키마. AI 응답은 일관성이 없었습니다. 때로는 훌륭했고, 때로는 사용자에게 "아름다운 Regina의 산"에 대해 낯선 사람에게 묻거나 "Stanley Park까지 토론토 지하철"을 타라고 제안하며 영어 연습을 권장했습니다.
출시일이 왔습니다. Reddit에 게시하고, 새내기들을 위한 몇몇 Facebook 그룹에 공유했으며, 승객 몇 명에게 사용해보도록 설득했습니다. 피드백은... 교육적이었습니다. 영어를 배우는 사람들은 가끔 어느 도시를 탐색하도록 돕고 있는지 잊어버리는 AI와 연습하고 싶어하지 않는다는 것이 밝혀졌습니다. 한 사용자는 아직도 저를 괴롭히는 리뷰를 남겼습니다: "앱이 'Vancouver 스타일 피자'를 주문해보라고 말했어요. 세 군데에 물어봤는데 아무도 그게 뭔지 몰라요. 앱도 몰라요."
2개월 후 총 사용자: 미미한 채택. 배운 교훈: 아마도 그들을 위한 솔루션을 만들기 전에 대상 시장을 이해하세요.
주차장에서 피보팅하기
우버 승차 사이에 만들 때 제품 실패는 다릅니다. 다음 단계를 논의할 팀 회의도, 피벗을 브레인스토밍할 화이트보드 세션도 없습니다. 그저 저 혼자 새벽 1시에 Cactus Club 밖에 앉아, 활성 사용자가 0명임을 보여주는 Google Analytics를 응시하며, 승차 요청을 모니터링하는 동안 무엇이 잘못되었는지 알아내려고 노력합니다.
피벗은 특히 한산한 화요일 밤에 일어났습니다. 다운타운 호텔 밖에 주차해 제 언어 학습 앱의 참여 지표가 평탄해지는 것을 지켜보고 있을 때, 두 승객이 그들의 스타트업 블로그에 좋은 콘텐츠 제작자를 찾는 것이 얼마나 불가능한지에 대해 이야기하는 것을 우연히 들었습니다. 그들은 기술 콘텐츠가 필요했고, 빨리 필요했으며, 양질의 글쓰기에 기꺼이 좋은 돈을 지불할 의사가 있었습니다.
아이디어가 번뜩였습니다: 기술 콘텐츠를 위한 AI 작문 비서를 만들면 어떨까? 또 다른 일반적인 AI 작문 도구가 아니라, SaaS 회사, 스타트업, 개발자 — SEO 키워드 목표를 맞추려는 로봇이 쓴 것처럼 들리지 않는 콘텐츠가 필요한 사람들을 위해 특별히 설계된 무언가.
저는 그날 밤 만들기 시작했습니다. 새 GitHub 저장소, 새 제품 비전, 같은 깨진 화면과 끔찍한 자세. 이번에는 아키텍처에 대해 더 똑똑해졌습니다 — 적어도 그렇게 생각했습니다. 더 깔끔한 API 디자인, 더 나은 데이터베이스 구조, 더 신중한 프롬프트 엔지니어링. AI는 기술 블로그 게시물, API 문서, 제품 설명, 심지어 특히 장황한 난수 생성기에 의해 생성된 것처럼 들리지 않는 코드 주석을 작성할 수 있었습니다.
아무도 경고하지 않는 기술적 악몽
솔로 개발자로서 AI 제품을 만드는 것은 악기의 절반이 불타고 악보가 공연 중에 계속 바뀌는 1인 오케스트라와 같습니다. 모든 통합이 다르게 고장 납니다. 모든 API에는 치명적으로 실패하는 고유한 방식이 있습니다.
OpenAI의 API는 무작위로 제가 생각하기에 포르투갈어로 응답을 반환하기 시작했지만, 특정 프롬프트 유형에 대해서만, 화요일에만, 수성이 역행할 때만 그랬습니다. Anthropic의 Claude는 몇 주 동안 완벽하게 작동하다가 갑자기 "조작적"일 수 있다는 이유로 마케팅 카피를 작성하지 않는 것에 대해 강한 의견을 발전시켰습니다. 저는 실제 기능을 구축하는 것보다 API 특이점을 관리하는 데 더 많은 시간을 보냈습니다.
벡터 데이터베이스는 임베딩 저장이 간단할 것이라고 생각한 인디 개발자들을 위한 특별 지옥입니다. Pinecone은 잘 작동하다가 작동하지 않았습니다. Weaviate는 실제로 기능하는 방식과 전혀 일치하지 않는 아름다운 문서를 가지고 있었습니다. 제 자신의 벡터 저장 솔루션을 구축하려고 시도했고, 인덱싱 작업 중에 제 노트북이 우려스러운 소음을 내기 시작할 무렵 그것이 왜 나쁜 생각인지 배웠습니다.
인프라 비용이 저를 갉아먹고 있었습니다. 모든 실험, 모든 테스트, 적절한 속도 제한을 추가하는 것을 잊을 때마다 — Vancouver의 심야 승객을 운전하며 벌 수 있는 것보다 더 빠르게 제 AWS 계정에서 돈이 빠져나갔습니다. 제가 생각할 수 있는 모든 것을 최적화했습니다: 간단한 작업을 위한 더 작은 모델, 응답 캐싱, 토큰 사용량을 줄이기 위한 공격적인 프롬프트 엔지니어링. 실제 수익은 완고하게 0을 유지하는 동안 컴퓨팅 비용에 돈을 계속 태우고 있었습니다.
예상치 못한 곳에서 사용자 찾기
차에서 AI 제품을 마케팅하는 것은 초현실적입니다. 빨간불에서 기다리는 동안 Twitter에 스크린샷을 게시하고, 승객 픽업 사이에 Hacker News 댓글에 응답하고, 잠재 고객의 청중을 구축하려고 노력하는 동안 제 주 직업은 제가 기술 창업가로 변신하고 있다는 사실을 전혀 모르는 사람들을 태우고 다니는 것입니다.
돌파구는 예상치 못한 곳에서 왔습니다: 제 우버 승객들. 기술 업계에서 일하는 것처럼 보이는 사람에게 제 AI 작문 도구를 언급하기 시작했습니다. Vancouver의 스타트업 씬은 놀랍도록 작고, 분명 모두가 서로를 알고 있는 것 같습니다. 다운타운 코워킹 스페이스에서 YVR까지 데려다준 한 데이터 과학자가 제 도구를 사용해보고 좋아했습니다. 그녀는 저를 그녀의 스타트업 마케팅 팀에 소개해주었습니다. 그들이 제 첫 번째 유료 고객이 되었습니다.
입소문은 Vancouver의 기술 커뮤니티를 통해 자연스럽게 퍼졌습니다. 커피숍 대화, 참석할 수 없었던 네트워킹 행사(운전 중이었기 때문에), 초기 사용자들이 동료들과 제 도구를 공유한 Slack 그룹. 저는 전통적인 마케팅 채널을 통해 확장하는 것이 아니었습니다 — 저는 모든 사람이 대략 2단계 분리로 연결된 Vancouver 같은 도시에만 존재하는 라이드쉐어링과 기술 네트워킹의 이상한 교차점을 통해 성장하고 있었습니다.
수익이 들어오기 시작했습니다: 첫 달에는 적은 금액, 이후 몇 달 동안 꾸준히 증가했습니다. 인생을 바꿀 돈은 아니었지만, AWS 청구서를 감당하고 새벽 3시 디버깅 세션을 위해 더 나은 커피를 살 수 있을 정도였습니다. 더 중요하게는, 사람들이 실제로 제가 만든 것을 사용하고 있었습니다. AI는 실제 회사들이 게시하고 있는 콘텐츠, 콘텐츠 공장이나 키워드 채우기 공장에서 나온 것처럼 들리지 않는 콘텐츠를 생성하고 있었습니다.
검증의 함정
성공은 혼자 빌드할 때 위험합니다. 첫 수익의 맛, 첫 긍정적인 사용자 리뷰, 코드가 실제 문제를 해결하는 것을 보는 만족감 — 그것은 중독성 있습니다. 저는 해결책을 찾았다고, 제 Honda Civic에 앉아 AI 제품 개발의 비밀을 풀었다고 생각하기 시작했습니다.
저는 건방져졌습니다. 제품 2를 제대로 확장하기도 전에 제품 3을 계획하기 시작했습니다. 중소기업의 전체 콘텐츠 파이프라인을 혁신할 야심 찬 AI 기반 콘텐츠 관리 시스템을 구상하기 시작했습니다. 범위 확장은 실제였고 장관이었습니다.
한편, 기존 사용자들은 제가 구축하지 않은 기본 기능을 요구하고 있었습니다: 더 나은 콘텐츠 구성, 협업 도구, 그들이 실제로 사용하는 플랫폼과의 통합. 듣는 대신, 저는 다음 반짝이는 AI 기능을 쫓고 있었고, 진정으로 유용한 것이 아니라 기술적으로 인상적인 것을 만들려고 하고 있었습니다.
각성은 제 가장 큰 고객(콘텐츠 생성에 상당한 금액을 지불하던 스타트업)과의 특히 솔직한 대화 중에 왔습니다. 그들은 AI의 출력 품질을 좋아했지만, 도구 자체는 투박하고 명백한 기능이 빠져 있었습니다. 그들은 팀과 공유하기 위해 콘텐츠를 Google Docs에 복사하고, 생성한 내용을 수동으로 추적하고, 콘텐츠 아이디어의 스프레드시트를 유지하고 있었습니다. 제 제품이 그 작업 흐름을 전혀 처리하지 않았기 때문입니다.
사람들이 실제로 원하는 것 만들기
그 피드백 세션이 모든 것을 바꾸었습니다. 저는 웅대한 비전 작업을 중단하고 실제 사용자들이 매일 겪고 있는 지루한 문제들을 고치기 시작했습니다. 더 나은 파일 구성, 팀 협업, 콘텐츠 캘린더, 이해하기 쉬운 사용 분석. 섹시한 기능도, AI 돌파구도 아니고, 그저 사람들의 삶을 약간 더 편리하게 만드는 견고한 제품 개발이었습니다.
기술 작업은 덜 흥미로웠지만 더 중요했습니다. 적절한 사용자 인증 구축, 파일 공유 구현, 3초 안에 로드되는 대시보드 보기 생성. AI 모델을 훈련시키는 것보다 데이터베이스 쿼리를 최적화하는 데 더 많은 시간을 보냈고, 프롬프트 엔지니어링 돌파구보다 UX 개선에 더 많은 시간을 보냈습니다.
수익은 월 대비 꾸준히 성장했습니다. 아직 우버를 그만둘 정도는 아니지만, 그 전환이 어떻게 보일지 생각해보기 시작할 정도는 되었습니다. 제 사용자들은 계속 머물렀고, 더 높은 등급으로 업그레이드했으며, 동료들을 추천했습니다. 제품은 기술적으로 영리하기보다는 진정으로 유용해지고 있었습니다.
앞으로의 긴 여정
저는 여전히 우버를 운전하고, 승차 사이에 AI 제품을 만들고, Vancouver 전역의 주차장에서 배포 문제를 디버깅하고 있습니다. 하지만 무언가 바뀌었습니다. 이것은 더 이상 사이드 허슬이 아닙니다 — 천천히, 지저분하게, 제가 전혀 예상하지 못한 방식으로 진짜 사업이 되어가고 있습니다.
AI 생태계는 여전히 제가 따라잡을 수 있는 것보다 빠르게 움직이고 있습니다. 새로운 모델, 새로운 기능, 매주 출시되는 새로운 경쟁자. 하지만 저는 성공이 가장 진보된 AI나 가장 혁신적인 기능을 갖는 것이 아니라는 것을 이해하기 시작했습니다. 그것은 개발 환경이 2018 Honda Civic의 앞 좌석일지라도 일관되고 안정적으로 실제 사람들의 실제 문제를 해결하는 것입니다.
아직 갈 길이 멉니다. 밤에 운전을 그만둘 수 있으려면 수익이 상당히 성장해야 합니다. 제품 로드맵은 돌이켜보면 명백해 보이지만 제가 잠과 사생활에서 훔치고 있는 개발 시간을 필요로 하는 기능들로 가득합니다. 경쟁은 증가하고 있으며, VC의 지원을 받는 스타트업들은 경험이 풍부한 개발자 팀과 제 연간 수입을 왜소하게 만드는 마케팅 예산을 가지고 비슷한 도구를 구축하고 있습니다.
하지만 저는 여전히 여기 있고, 여전히 만들고 있으며, 차에서 AI 회사를 부트스트래핑하는 것이 어떻게든 실행 가능한 경력 경로라고 확신하고 있습니다. 제가 망상에 빠졌을 수도 있습니다. 어쩌면 이 전체 실험이 장관을 이루며 실패하고 앞으로 5년 동안 우버를 운전하게 될 수도 있습니다. 아니면 어쩌면, 정말 어쩌면, 저는 새벽 코딩 세션과 고객 대화를 실제 비즈니스와 비슷한 것으로 바꾸는 방법을 알아낼 수도 있습니다. 어느 쪽이든, 저는 모든 실수, 모든 작은 승리, 이 모든 것이 말이 되는지 의문을 품는 모든 순간을 기록할 것입니다. 우버 승차 사이에 AI 제품을 만들면서 배운 한 가지가 있다면, 그것은 여정이 제가 계획할 수 있었던 어떤 결과보다 더 낯설고 교육적이라는 것입니다.
AI-producten bouwen tussen Uber-ritten: mijn waanvoorstellingen-dagboek van een ontwikkelaar
Het is middernacht en ik zit in mijn Honda Civic voor een bubble tea-winkel op Commercial Drive, terwijl ik toekijk hoe mijn laptopaccu langzaam leegloopt terwijl ik de meest pijnlijke API-integratiefout van mijn leven aan het debuggen ben. De dronken universiteitsstudenten die ik vijf minuten geleden afzette, betaalden contant en strompelden naar wat ik aanneem hun studentenhuis was, en lieten me alleen achter met mijn gedachten en een codebase die meer spaghetti dan software is. Dit is nu mijn leven: Uber-chauffeur in Vancouver bij nacht, aspirant-AI-ondernemer tijdens de prijsverhogingsstiltes.
Zes maanden geleden had ik nul AI-ervaring en een informaticadiploma dat ik niet gebruikte. Nu heb ik drie halfafgemaakte AI-producten, een GitHub vol verlaten repositories, en genoeg afwijzingsmails van investeerders om mijn studioappartement in Burnaby mee te behangen. Maar ik ben er nog steeds, aan het bouwen, en probeer mezelf ervan te overtuigen dat de volgende implementatie degenen zal zijn die alles verandert.
De realiteitscheck waar niemand over praat
Iedereen op Twitter laat onafhankelijke AI-ontwikkeling er glamoureus uitzien. Plaats een screenshot van je inkomstenoverzicht, deel een inspirerende quote over 'bouwen in het openbaar', en kijk hoe de likes binnenstromen. De realiteit is lelijker. Ik bouw producten in parkeerplaatsen van Tim Hortons om 3 uur 's nachts, omdat dat het moment is dat toeristen stoppen met ritten aanvragen en ik eindelijk tijd heb om te coderen.
Mijn huidige opstelling is zielig: een MacBook Pro uit 2019 met een gebarsten scherm, een telefoon-hotspot voor internet die elke keer wegvalt als er een bus voorbijrijdt, en een autostoel die niet ontworpen is voor mensen om acht uur lang Python-scripts te debuggen. Mijn rug is permanent verkrampt door het vooroverbuigen over mijn laptop in krappe ruimtes, en ik ken elke 24-uurskoffiezaak tussen downtown en Richmond uit mijn hoofd, omdat het de enige plekken zijn met betrouwbare WiFi en toiletten.
Het AI-ontwikkelingsecosysteem beweegt zo snel dat elke tutorial die ik bladwijzer, verouderd is voordat ik hem uit heb. OpenAI brengt een nieuw model uit, Anthropic werkt hun API bij, Google kondigt iets aan dat alles wat ik aan het bouwen ben mogelijk irrelevant maakt. Ik ben constant dezelfde functies aan het herbouwen omdat de onderliggende technologie is veranderd terwijl ik dronken mensen van Granville Street naar huis reed.
Product één: de taalleerramp
Mijn eerste AI-product zou een revolutie teweegbrengen in het leren van talen voor immigranten in Vancouver. Want er is niets dat 'je markt begrijpen' beter weergeeft dan een man die alleen Engels spreekt en taaltools bouwt voor mensen die Engels leren, toch?
Het concept leek solide: een AI-tutor die nieuwkomers hielp Engels te oefenen aan de hand van Vancouver-specifieke scenario's. Koffie bestellen bij JJ Bean, de weg vragen naar VCC, een gesprek voeren met een verhuurder over BC Hydro-rekeningen. Echte situaties waar ze daadwerkelijk mee te maken zouden krijgen, aangedreven door GPT-4 met aangepaste prompts die de lokale context begrepen.
Ik heb drie weken besteed aan het bouwen van dit ding tussen de ritten door. Geparkeerd bij YVR wachtend op ritten van het vliegveld, gespreksstromen coderend. Zittend in de McDonald's op Robson om 2 uur 's nachts, de AI trainen op Vancouver-slang en lokale verwijzingen. De app kon realistische dialogen genereren over alles, van SkyTrain-vertragingen tot het uitleggen van het verschil tussen Vancouver en North Vancouver aan verwarde toeristen.
De technische implementatie was een puinhoop. Ik heb het over statusbeheer dat bij elkaar werd gehouden door gebed, een databaseschema dat logisch was om 4 uur 's nachts, maar eruitzag als abstracte kunst tijdens debugsessies bij daglicht. De AI-reacties waren inconsistent — soms briljant, soms aanbevelend dat gebruikers Engels oefenden door vreemden te vragen naar "de prachtige bergen van Regina" of voorstellend dat ze de "Toronto-metro naar Stanley Park" namen.
De lanceringsdag brak aan. Ik plaatste op Reddit, deelde in wat Facebook-groepen voor nieuwkomers, overtuigde zelfs een paar passagiers om het uit te proberen. De feedback was... leerzaam. Het blijkt dat mensen die Engels leren niet willen oefenen met een AI die af en toe vergeet in welke stad het hen moet helpen navigeren. Een gebruiker liet een recensie achter die me nog steeds achtervolgt: "De app zei dat ik 'Vancouver-style pizza' moest bestellen. Ik heb het op drie plekken gevraagd. Niemand weet wat dat betekent. De app ook niet."
Totaal aantal gebruikers na twee maanden: minimale adoptie. Les geleerd: begrijp je doelmarkt voordat je er oplossingen voor bouwt.
Pivoteren op een parkeerplaats
Productfalen is anders als je tussen Uber-ritten door bouwt. Er is geen teambijeenkomst om volgende stappen te bespreken, geen whiteboardsessie om te brainstormen over pivotpunten. Alleen ik, zittend voor Cactus Club om 1 uur 's nachts, starend naar Google Analytics dat nul actieve gebruikers laat zien, terwijl ik probeer te achterhalen wat er misging terwijl ik monitor op ritverzoeken.
De pivot kwam tijdens een bijzonder saaie dinsdagavond. Ik stond geparkeerd voor een hotel in het centrum, keek naar de betrokkenheidsstatistieken van mijn taalleerapp die afvlakten, toen ik twee passagiers hoorde praten over hoe onmogelijk het was om goede contentmakers te vinden voor de blog van hun startup. Ze hadden technische content nodig, snel, en waren bereid goed te betalen voor kwalitatief schrijfwerk.
Lichtbolmoment: Wat als ik een AI-schrijfassistent bouwde, specifiek voor technische content? Niet weer een generieke AI-schrijftool, maar iets dat speciaal was ontworpen voor SaaS-bedrijven, startups, ontwikkelaars — mensen die content nodig hadden die niet klonk alsof het geschreven was door een robot die probeerde SEO-trefwoorddoelen te halen.
Ik begon die avond met bouwen. Nieuwe GitHub-repo, nieuwe productvisie, hetzelfde gebarsten laptopschema en verschrikkelijke houding. Dit keer was ik slimmer met de architectuur — of dat dacht ik tenminste. Schonere API-ontwerp, betere databasestructuur, doordachter prompt-techniek. De AI kon technische blogposts, API-documentatie, productbeschrijvingen, en zelfs codecommentaar schrijven dat niet klonk alsof het gegenereerd was door een bijzonder uitgebreide willekeurige getallengenerator.
De technische nachtmerrie waar niemand je voor waarschuwt
AI-producten bouwen als solo-ontwikkelaar is alsof je een eenmansorkest bent waarbij de helft van de instrumenten in brand staat en de bladmuziek halverwege de uitvoering blijft veranderen. Elke integratie werkt anders. Elke API heeft zijn eigen speciale manier om catastrofaal te falen.
OpenAI's API begon willekeurig reacties terug te geven in wat ik denk dat Portugees was, maar alleen voor bepaalde prompttypen, alleen op dinsdagen, alleen als Mercurius retrograde was. Anthropic's Claude werkte wekenlang perfect, maar ontwikkelde dan plotseling sterke meningen over het niet schrijven van marketingkopij omdat het "manipulatief" zou kunnen zijn. Ik besteedde meer tijd aan het beheren van API-afwijkingen dan aan het bouwen van daadwerkelijke functies.
Vector-databases zijn de speciale hel die is voorbehouden aan onafhankelijke ontwikkelaars die dachten dat het opslaan van embeddings eenvoudig zou zijn. Pinecone werkte geweldig tot het dat niet deed. Weaviate had prachtige documentatie die geen enkele overeenkomst vertoonde met hoe iets daadwerkelijk functioneerde. Ik probeerde mijn eigen vectoropslagoplossing te bouwen en leerde waarom dat een slecht idee is, ongeveer op het moment dat mijn laptop verontrustende geluiden begon te maken tijdens indexeringsbewerkingen.
De infrastructuurkosten vraten me op. Elk experiment, elke test, elke keer dat ik vergat de juiste snelheidsbeperking toe te voegen — geld vloog mijn AWS-account uit sneller dan ik het kon verdienen door rond te rijden met Vancouver's nachtelijke publiek. Ik optimaliseerde alles wat ik kon bedenken: kleinere modellen voor eenvoudige taken, responscaching, agressieve prompt-techniek om tokenverbruik te verminderen. Nog steeds brandde ik geld op aan rekenkosten terwijl mijn daadwerkelijke inkomsten koppig op nul bleven staan.
Gebruikers vinden op onverwachte plekken
Een AI-product vanuit je auto marketen is surreëel. Ik plaats screenshots op Twitter terwijl ik wacht voor stoplichten, reageer op Hacker News-commentaren tussen passagiersophaaldiensten, en probeer een publiek van potentiële klanten op te bouwen terwijl mijn primaire baan bestaat uit het rondrijden van mensen die geen idee hebben dat ik als tech-ondernemer bijklus.
De doorbraak kwam uit een onverwachte bron: mijn Uber-passagiers. Ik begon mijn AI-schrijftool te noemen tegen iedereen die eruitzag alsof ze in de tech werkten. De startup-scene van Vancouver is verrassend klein, en blijkbaar kent iedereen iedereen. Een datawetenschapper die ik van een coworkingruimte in het centrum naar YVR reed, probeerde mijn tool en vond het geweldig. Ze stelde me voor aan het marketingteam van haar startup. Ze werden mijn eerste betalende klanten.
Het nieuws verspreidde zich organisch door de tech-gemeenschap van Vancouver. Gesprekken in koffiezaken, netwerkevenementen die ik niet kon bijwonen omdat ik aan het rijden was, Slack-groepen waar mijn vroege gebruikers mijn tool deelden met hun collega's. Ik schaalde niet via traditionele marketingkanalen — ik groeide door de vreemde kruising van ride-sharing en tech-netwerken die alleen bestaat in steden zoals Vancouver, waar iedereen verbonden is met ongeveer twee graden van scheiding.
Inkomsten begonnen binnen te druppelen: bescheiden bedragen in de eerste maand, gestaag groeiend in de daaropvolgende maanden. Geen levensveranderend geld, maar genoeg om mijn AWS-rekeningen te dekken en betere koffie te kopen voor die debugsessies om 3 uur 's nachts. Belangrijker nog: mensen gebruikten daadwerkelijk wat ik had gebouwd. De AI genereerde content die echte bedrijven publiceerden, content die niet klonk alsof het uit een contentmolen of trefwoordvulfabriek kwam.
De validatieval
Succes is gevaarlijk als je solo bouwt. Die eerste smaak van inkomsten, die eerste positieve gebruikersreviews, de voldoening van het zien dat je code daadwerkelijk echte problemen oplost — het is bedwelmend. Ik begon te denken dat ik het had uitgevogeld, dat ik de code had gekraakt voor AI-productontwikkeling terwijl ik in mijn Honda Civic zat.
Ik werd overmoedig. Begon Product Drie te plannen voordat ik Product Twee goed had opgeschaald. Begon te schetsen aan een ambitieus AI-aangedreven contentmanagementsysteem dat een revolutie teweeg zou brengen in hoe kleine bedrijven hun hele contentpijplijn beheerden. De scope creep was echt en spectaculair.
Ondertussen vroegen mijn bestaande gebruikers om basisfuncties die ik niet had gebouwd: betere contentorganisatie, samenwerkingstools, integraties met platforms die ze daadwerkelijk gebruikten. In plaats van te luisteren, jaagde ik de volgende glimmende AI-mogelijkheid na, in een poging iets technisch indrukwekkends te bouwen in plaats van iets dat echt nuttig was.
Het ontwaken kwam tijdens een bijzonder eerlijk gesprek met mijn grootste klant, een startup die me behoorlijk betaalde voor hun contentgeneratie. Ze waren dol op de outputkwaliteit van de AI, maar de tool zelf was onhandig en miste voor de hand liggende functies. Ze kopieerden content naar Google Docs om te delen met hun team, hielden handmatig bij wat ze hadden gegenereerd, en bewaarden spreadsheets met contentideeën omdat mijn product geen van die workflows aanpakte.
Bouwen wat mensen daadwerkelijk willen
Die feedbacksessie veranderde alles. Ik stopte met werken aan de grote visie en begon de saaie problemen op te lossen waar mijn daadwerkelijke gebruikers dagelijks mee te maken hadden. Betere bestandsorganisatie, teamsamenwerking, contentkalenders, gebruiksanalyses die logisch waren. Geen sexy functies, geen AI-doorbraken, gewoon solide productontwikkeling die het leven van mensen iets gemakkelijker maakte.
Het technische werk was minder interessant maar belangrijker. Het bouwen van goede gebruikersauthenticatie, het implementeren van bestandsdeling, het creëren van dashboardweergaven die binnen drie seconden laadden. Ik besteedde meer tijd aan het optimaliseren van databasequery's dan aan het trainen van AI-modellen, meer tijd aan UX-verbeteringen dan aan doorbraken in prompt-techniek.
De inkomsten groeiden gestaag maand na maand. Nog steeds niet genoeg om te stoppen met Uber, maar genoeg om te beginnen nadenken over hoe die overstap eruit zou kunnen zien. Mijn gebruikers bleven hangen, upgradeerden naar hogere niveaus, verwezen collega's door. Het product werd werkelijk nuttig in plaats van alleen technisch slim.
De lange weg vooruit
Ik rijd nog steeds Uber, bouw nog steeds AI-producten tussen ritten, debug nog steeds implementatieproblemen op parkeerplaatsen in Vancouver. Maar er is iets veranderd. Dit is niet langer alleen een bijverdienste — het wordt een echt bedrijf, langzaam en rommelig en op manieren die ik nooit had verwacht.
Het AI-ecosysteem beweegt nog steeds sneller dan ik kan bijbenen. Nieuwe modellen, nieuwe mogelijkheden, nieuwe concurrenten die elke week lanceren. Maar ik begin te begrijpen dat succes niet gaat om het hebben van de meest geavanceerde AI of de meest innovatieve functies. Het gaat om het oplossen van echte problemen voor echte mensen, consistent en betrouwbaar, zelfs als je ontwikkelomgeving de voorstoel is van een Honda Civic uit 2018.
Er is nog een lange weg te gaan. De inkomsten moeten aanzienlijk groeien voordat ik kan stoppen met nachtrijden. De productroadmap zit vol met functies die achteraf voor de hand liggen, maar weken ontwikkelingstijd vergen die ik steel van slaap en sociaal leven. De concurrentie neemt toe, en met VC gefinancierde startups bouwen vergelijkbare tools met teams van ervaren ontwikkelaars en marketingbudgetten die mijn jaarinkomen doen verbleken.
Maar ik ben er nog steeds, aan het bouwen, nog steeds overtuigd dat het bootstrappen van een AI-bedrijf vanuit je auto op de een of andere manier een haalbaar carrièrepad is. Misschien heb ik waanvoorstellingen. Misschien zal dit hele experiment spectaculair mislukken en rijd ik de komende vijf jaar Uber. Of misschien, heel misschien, zal ik erachter komen hoe ik late-night codeersessies en klantgesprekken kan omzetten in iets dat op een echt bedrijf lijkt. Hoe dan ook, ik zal elke fout, elke kleine overwinning, elk moment van twijfel of dit allemaal wel zin heeft, documenteren. Want als er één ding is dat ik heb geleerd van het bouwen van AI-producten tussen Uber-ritten, is het dat de reis vreemder en leerzamer is dan elk resultaat dat ik had kunnen plannen.
Budowanie produktów AI między kursami Ubera: Mój urojony pamiętnik dewelopera
Jest po północy, a ja siedzę w swoim Honda Civic przed sklepem z herbatą bubble na Commercial Drive, patrząc, jak bateria mojego laptopa powoli się wyczerpuje, podczas gdy debuguję najbardziej żenującą porażkę integracji API w moim życiu. Pijani studenci, których wysadziłem pięć minut temu, zapłacili gotówką i potykając się, poszli w kierunku tego, co zakładam, że było ich akademikiem, zostawiając mnie samego z myślami i kodem, który jest bardziej spaghetti niż oprogramowaniem. To jest teraz moje życie: nocny kierowca Ubera w Vancouver, początkujący przedsiębiorca AI podczas przestojów między wzmożonym ruchem.
Sześć miesięcy temu nie miałem żadnego doświadczenia z AI i dyplom z informatyki, którego nie wykorzystywałem. Teraz mam trzy niedokończone produkty AI, GitHuba pełnego porzuconych repozytoriów i wystarczająco dużo e-maili z odmowami od inwestorów, by wykleić nimi moje kawalerskie mieszkanie w Burnaby. Ale wciąż tu jestem, wciąż buduję, wciąż namawiam siebie, że następne wdrożenie będzie tym, które wszystko zmieni.
Zderzenie z rzeczywistością, o którym nikt nie mówi
Wszyscy na Twitterze przedstawiają niezależny rozwój AI jako coś ekscytującego. Wrzuć zrzut ekranu swojego panelu przychodów, podziel się inspirującym cytatem o budowaniu publicznie, oglądaj napływające polubienia. Rzeczywistość jest brzydsza. Buduję produkty na parkingach Tim Hortons o 3 nad ranem, bo wtedy turyści przestają zamawiać przejazdy i wreszcie mam czas kodować.
Moja obecna konfiguracja jest żałosna: MacBook Pro z 2019 z pękniętym ekranem, hotspot z telefonu jako internet, który się wyłącza za każdym razem, gdy przejedzie autobus, i fotel samochodowy, który nie został zaprojektowany dla ludzi spędzających osiem godzin na debugowaniu skryptów w Pythonie. Mam trwale skręcone plecy od garbienia się nad laptopem w ciasnych przestrzeniach i zapamiętałem każdą całodobową kawiarnię między śródmieściem a Richmond, bo to jedyne miejsca z niezawodnym WiFi i toaletami.
Ekologia rozwoju AI zmienia się tak szybko, że każdy tutorial, który dodaję do zakładek, jest przestarzały, zanim skończę go czytać. OpenAI wydaje nowy model, Anthropic aktualizuje swoje API, Google ogłasza coś, co sprawia, że wszystko, nad czym pracuję, staje się potencjalnie nieistotne. Ciągle odbudowuję te same funkcje, bo podstawowa technologia zmieniła się, gdy woziłem pijanych ludzi z Granville Street.
Produkt pierwszy: Katastrofa nauki języka
Mój pierwszy produkt AI miał zrewolucjonizować naukę języków dla imigrantów w Vancouver. Bo nic nie mówi „rozumiem swój rynek" jak facet, który mówi tylko po angielsku, budujący narzędzia językowe dla ludzi uczących się angielskiego, prawda?
Koncepcja wydawała się solidna: korepetytor AI, który pomagał nowym przybyszom ćwiczyć angielski w scenariuszach specyficznych dla Vancouver. Zamów kawę w JJ Bean, zapytaj o drogę do VCC, przeprowadź rozmowę z wynajmującym o rachunkach za BC Hydro. Prawdziwe sytuacje, z którymi faktycznie się spotykają, napędzane przez GPT-4 z niestandardowymi promptami rozumiejącymi lokalny kontekst.
Spędziłem trzy tygodnie, budując to między kursami. Zaparkowany pod YVR, czekając na kursy na lotnisko, kodując przepływy rozmów. Siedząc w McDonaldzie na Robson o 2 nad ranem, trenując AI na lokalnym slangu i odniesieniach z Vancouver. Aplikacja mogła generować realistyczne dialogi o wszystkim, od opóźnień SkyTrain po wyjaśnianie różnicy między Vancouver a North Vancouver zdezorientowanym turystom.
Implementacja techniczna była tragiczna. Mówię o zarządzaniu stanem trzymanym w kupie przez modlitwę, schemacie bazy danych, który miał sens o 4 nad ranem, ale podczas dziennych sesji debugowania wyglądał jak abstrakcyjne malarstwo. Odpowiedzi AI były niespójne — czasami genialne, czasami zalecające użytkownikom ćwiczenie angielskiego przez pytanie nieznajomych o „piękne góry Reginy" lub sugerujące, by pojechali „torontyjskim metrem do Stanley Park."
Nadszedł dzień premiery. Opublikowałem post na Reddicie, udostępniłem w kilku grupach na Facebooku dla nowo przybyłych, a nawet przekonałem kilku pasażerów, by wypróbowali aplikację. Opinie były... pouczające. Okazuje się, że ludzie uczący się angielskiego nie chcą ćwiczyć z AI, która czasami zapomina, w jakim mieście ma im pomagać się poruszać. Jeden użytkownik zostawił recenzję, która wciąż mnie prześladuje: „Aplikacja kazała mi ćwiczyć zamawianie 'pizzy w stylu Vancouver.' Pytałem w trzech miejscach. Nikt nie wie, co to znaczy. Aplikacja też nie."
Łączna liczba użytkowników po dwóch miesiącach: minimalny odbiór. Wyciągnięte wnioski: Może zrozum swój rynek docelowy, zanim zaczniesz budować dla niego rozwiązania.
Pivot na parkingu
Porażka produktu wygląda inaczej, gdy budujesz między kursami Ubera. Nie ma spotkania zespołu, by omówić kolejne kroki, nie ma sesji przy białej tablicy, by burzyć mózgi nad pivotem. Tylko ja, siedzący przed Cactus Club o 1 w nocy, wpatrujący się w Google Analytics pokazujące zero aktywnych użytkowników, próbujący zrozumieć, co poszło nie tak, jednocześnie czekając na zgłoszenia przejazdów.
Pivot nastąpił podczas szczególnie leniwego wtorkowego wieczoru. Siedziałem zaparkowany przed hotelem w centrum, obserwując, jak wskaźniki zaangażowania mojej aplikacji do nauki języków spłaszczają się, gdy usłyszałem dwóch pasażerów rozmawiających o tym, jak niemożliwe jest znalezienie dobrych twórców treści dla bloga ich startupu. Potrzebowali treści technicznych, potrzebowali ich szybko i byli skłonni dobrze zapłacić za jakościowe pisanie.
Moment olśnienia: A gdybym zbudował asystenta pisania AI specjalnie dla treści technicznych? Nie kolejne ogólne narzędzie do pisania AI, ale coś stworzonego specjalnie dla firm SaaS, startupów, deweloperów — ludzi, którzy potrzebują treści, które nie brzmią jak napisane przez robota próbującego trafić w cele SEO.
Zacząłem budować tej nocy. Nowe repozytorium GitHub, nowa wizja produktu, ten sam pęknięty ekran laptopa i okropna postawa. Tym razem byłem mądrzejszy, jeśli chodzi o architekturę — a przynajmniej tak myślałem. Czystszy projekt API, lepsza struktura bazy danych, bardziej przemyślana inżynieria promptów. AI mogło pisać techniczne posty na bloga, dokumentację API, opisy produktów, a nawet komentarze do kodu, które nie brzmiały jak wygenerowane przez szczególnie gadatliwy generator liczb losowych.
Koszmar techniczny, o którym nikt cię nie ostrzega
Budowanie produktów AI jako samodzielny deweloper jest jak bycie jednoosobową orkiestrą, w której połowa instrumentów płonie, a nuty zmieniają się w trakcie występu. Każda integracja psuje się inaczej. Każde API ma swój własny, specjalny sposób na katastrofalną awarię.
API OpenAI’a losowo zaczynało zwracać odpowiedzi w tym, co myślę, że było portugalskim, ale tylko dla niektórych typów promptów, tylko we wtorki, tylko gdy Merkury był w retrogradacji. Claude od Anthropic działał idealnie przez tygodnie, a potem nagle wyrabiał sobie silne opinie na temat niepisania tekstów marketingowych, bo mogłyby być „manipulujące." Spędzałem więcej czasu na zarządzaniu dziwactwami API niż na budowaniu rzeczywistych funkcji.
Bazy danych wektorowych to szczególne piekło zarezerwowane dla niezależnych deweloperów, którzy myśleli, że przechowywanie osadzeń (embeddings) będzie proste. Pinecone działał świetnie, aż przestał. Weaviate miał piękną dokumentację, która nie miała nic wspólnego z tym, jak wszystko faktycznie działało. Próbowałem zbudować własne rozwiązanie do przechowywania wektorów i dowiedziałem się, dlaczego to zły pomysł, mniej więcej wtedy, gdy mój laptop zaczął wydawać niepokojące dźwięki podczas operacji indeksowania.
Koszty infrastruktury zjadały mnie żywcem. Każdy eksperyment, każdy test, każdy raz, gdy zapomniałem dodać odpowiedniego ograniczania prędkości — pieniądze uciekały z mojego konta AWS szybciej, niż mogłem je zarobić, wożąc nocnych klientów po Vancouver. Optymalizowałem wszystko, co mogłem wymyślić: mniejsze modele do prostych zadań, buforowanie odpowiedzi, agresywną inżynierię promptów, by zmniejszyć użycie tokenów. Wciąż przepalałem pieniądze na koszty obliczeniowe, podczas gdy moje rzeczywiste przychody uparcie pozostawały zerowe.
Znajdowanie użytkowników w nieoczekiwanych miejscach
Marketing produktu AI z samochodu jest surrealistyczny. Wrzucam zrzuty ekranu na Twittera, czekając na czerwonych światłach, odpowiadam na komentarze na Hacker News między odbieraniem pasażerów, próbując zbudować publiczność potencjalnych klientów, podczas gdy moja główna praca polega na wożeniu ludzi, którzy nie mają pojęcia, że dorabiam jako przedsiębiorca technologiczny.
Przełom nastąpił z nieoczekiwanego źródła: moich pasażerów Ubera. Zacząłem wspominać o moim narzędziu do pisania AI każdemu, kto wyglądał na pracującego w technologiach. Scena startupowa w Vancouver jest zaskakująco mała i najwyraźniej wszyscy znają wszystkich. Analityczka danych, którą zawiozłem z przestrzeni coworkingowej w centrum na YVR, wypróbowała moje narzędzie i pokochała je. Przedstawiła mnie zespołowi marketingowemu swojego startupu. Stali się moimi pierwszymi płacącymi klientami.
Słowo rozeszło się organicznie wśród społeczności technologicznej Vancouver. Rozmowy w kawiarniach, wydarzenia networkingowe, na które nie mogłem iść, bo prowadziłem, grupy na Slacku, w których moi pierwsi użytkownicy dzielili się moim narzędziem ze współpracownikami. Nie skalowałem się przez tradycyjne kanały marketingowe — rosłem przez dziwne przecięcie się ride-sharingu i networkingu technologicznego, które istnieje tylko w miastach takich jak Vancouver, gdzie wszyscy są połączeni przez około dwa stopnie separacji.
Przychody zaczęły skapywać: skromne kwoty pierwszego miesiąca, stale rosnące w kolejnych miesiącach. Nie były to pieniądze zmieniające życie, ale wystarczające, by pokryć rachunki za AWS i kupić lepszą kawę na te sesje debugowania o 3 nad ranem. Co ważniejsze, ludzie faktycznie używali tego, co zbudowałem. AI generowało treści, które prawdziwe firmy publikowały, treści, które nie brzmiały jak z fabryki treści lub maszynki do upychania słów kluczowych.
Pułapka walidacji
Sukces jest niebezpieczny, gdy budujesz w pojedynkę. Ten pierwszy smak przychodów, te początkowe pozytywne recenzje użytkowników, satysfakcja z widzenia, jak twój kod faktycznie rozwiązuje prawdziwe problemy — to odurzające. Zacząłem myśleć, że to rozgryzłem, że złamałem kod rozwoju produktów AI, siedząc w moim Honda Civic.
Stałem się arogancki. Zacząłem planować Produkt Trzeci, zanim odpowiednio rozwinąłem Produkt Drugi. Zaczęłam szkicować ambitny system zarządzania treścią oparty na AI, który miał zrewolucjonizować sposób, w jaki małe firmy obsługują cały swój potok treści. Rozszerzanie zakresu było realne i spektakularne.
Tymczasem moi dotychczasowi użytkownicy prosili o podstawowe funkcje, których nie zbudowałem: lepszą organizację treści, narzędzia do współpracy, integracje z platformami, których faktycznie używali. Zamiast słuchać, goniłem za kolejną błyszczącą możliwością AI, próbując zbudować coś technicznie imponującego, zamiast czegoś naprawdę użytecznego.
Przebudzenie nastąpiło podczas szczególnie szczerej rozmowy z moim największym klientem, startupem, który płacił mi znaczące kwoty za generowanie treści. Uwielbiali jakość wyników AI, ale samo narzędzie było toporne i brakowało mu oczywistych funkcji. Kopiowali treści do Google Docs, by dzielić się nimi z zespołem, ręcznie śledząc, co wygenerowali, prowadząc arkusze kalkulacyjne pomysłów na treści, bo mój produkt nie obsługiwał żadnego z tych przepływów pracy.
Budowanie tego, czego ludzie naprawdę chcą
Ta sesja opinii zmieniła wszystko. Przestałem pracować nad wielką wizją i zacząłem naprawiać nudne problemy, z którymi moi prawdziwi użytkownicy mierzyli się każdego dnia. Lepsza organizacja plików, współpraca zespołowa, kalendarze treści, analityka użycia, która miała sens. Nie seksowne funkcje, nie przełomy AI, tylko solidny rozwój produktu, który czynił życie ludzi nieco łatwiejszym.
Praca techniczna była mniej interesująca, ale ważniejsza. Budowanie prawidłowego uwierzytelniania użytkowników, implementowanie udostępniania plików, tworzenie widoków paneli, które ładowały się w mniej niż trzy sekundy. Spędzałem więcej czasu na optymalizacji zapytań do bazy danych niż na trenowaniu modeli AI, więcej czasu na ulepszenia UX niż na przełomy w inżynierii promptów.
Przychody rosły stale z miesiąca na miesiąc. Wciąż za mało, by rzucić Ubera, ale wystarczająco, by zacząć myśleć o tym, jak ta zmiana mogłaby wyglądać. Moi użytkownicy pozostawali, przechodzili na wyższe plany, polecali narzędzie współpracownikom. Produkt stawał się naprawdę użyteczny, a nie tylko technicznie sprytny.
Długa droga przed nami
Wciąż jeżdżę dla Ubera, wciąż buduję produkty AI między kursami, wciąż debuguję problemy z wdrożeniami na parkingach w całym Vancouver. Ale coś się zmieniło. To już nie jest tylko praca dodatkowa — to staje się prawdziwym biznesem, powoli i niechlujnie, i w sposób, jakiego nigdy się nie spodziewałem.
Ekologia AI wciąż zmienia się szybciej, niż jestem w stanie nadążyć. Nowe modele, nowe możliwości, nowi konkurenci uruchamiani co tydzień. Ale zaczynam rozumieć, że sukces nie polega na posiadaniu najbardziej zaawansowanego AI czy najbardziej innowacyjnych funkcji. Chodzi o rozwiązywanie prawdziwych problemów dla prawdziwych ludzi, konsekwentnie i niezawodnie, nawet jeśli twoim środowiskiem deweloperskim jest przedni fotel Hondy Civic z 2018 roku.
Wciąż długa droga przede mną. Przychody muszą znacząco wzrosnąć, zanim będę mógł przestać jeździć nocami. Mapa drogowa produktu jest pełna funkcji, które wydają się oczywiste z perspektywy czasu, ale wymagają tygodni czasu deweloperskiego, który kradnę ze snu i życia towarzyskiego. Konkurencja rośnie, a startupy finansowane przez VC budują podobne narzędzia z zespołami doświadczonych deweloperów i budżetami marketingowymi, które przyćmiewają mój roczny dochód.
Ale wciąż tu jestem, wciąż buduję, wciąż przekonany, że bootstrapowanie firmy AI z samochodu jest jakoś realną ścieżką kariery. Może jestem urojeniowy. Może cały ten eksperyment spektakularnie wypali i będę jeździł dla Ubera przez następne pięć lat. Albo może, tylko może, wymyślę, jak zamienić nocne sesje kodowania i rozmowy z klientami w coś, co przypomina prawdziwy biznes. Tak czy inaczej, będę dokumentował każdy błąd, każde małe zwycięstwo, każdy moment zwątpienia, czy to wszystko ma sens. Bo jeśli jest jedna rzecz, której nauczyłem się, budując produkty AI między kursami Ubera, to to, że podróż jest dziwniejsza i bardziej pouczająca niż jakikolwiek wynik, który mógłbym zaplanować.
Construindo Produtos de IA Entre Corridas de Uber: Meu Diário Delirante de Desenvolvedor
Já passou da meia-noite e estou sentado no meu Honda Civic do lado de fora de uma loja de bubble tea na Commercial Drive, vendo a bateria do meu laptop morrer lentamente enquanto depuro a falha de integração de API mais vergonhosa da minha vida. Os estudantes universitários bêbados que deixei cinco minutos atrás pagaram em dinheiro e cambalearam em direção ao que suponho ser o dormitório deles, deixando-me sozinho com meus pensamentos e uma base de código que é mais espaguete do que software. Esta é minha vida agora: motorista de Uber em Vancouver à noite, aspirante a empreendedor de IA durante os momentos de calmaria no surto de demanda.
Seis meses atrás, eu não tinha nenhuma experiência em IA e um diploma de Ciência da Computação que não estava usando. Agora tenho três produtos de IA pela metade, um GitHub cheio de repositórios abandonados e e-mails de rejeição de investidores suficientes para forrar o estúdio onde moro em Burnaby. Mas ainda estou aqui, ainda construindo, ainda me convencendo de que o próximo deploy será o que vai mudar tudo.
A Realidade que Ninguém Comenta
Todo mundo no Twitter faz o desenvolvimento independente de IA parecer glamouroso. Poste uma captura de tela do seu painel de receita, compartilhe alguma citação inspiradora sobre construir em público, veja os likes chegarem. A realidade é mais feia. Estou construindo produtos em estacionamentos do Tim Hortons às 3 da manhã porque é quando os turistas param de pedir corridas e eu tenho tempo para programar.
Minha configuração atual é patética: MacBook Pro 2019 com tela rachada, hotspot do celular para internet que cai toda vez que um ônibus passa, e um banco de carro que não foi projetado para humanos passarem oito horas debugando scripts em Python. Minhas costas estão permanentemente tortas de tanto me curvar sobre o laptop em espaços apertados, e memorizei todas as cafeterias 24 horas entre o centro e Richmond porque são os únicos lugares com WiFi confiável e banheiros.
O ecossistema de desenvolvimento de IA está se movendo tão rápido que qualquer tutorial que eu salve está obsoleto antes que eu termine de lê-lo. OpenAI lança um novo modelo, Anthropic atualiza sua API, Google anuncia algo que torna tudo o que estou trabalhando potencialmente irrelevante. Estou constantemente reconstruindo as mesmas funcionalidades porque a tecnologia subjacente mudou enquanto eu dirigia bêbados para casa saindo da Granville Street.
Produto Um: O Desastre do Aprendizado de Idiomas
Meu primeiro produto de IA ia revolucionar o aprendizado de idiomas para imigrantes em Vancouver. Porque nada diz "entender seu mercado" como um cara que só fala inglês construindo ferramentas de idiomas para pessoas aprendendo inglês, certo?
O conceito parecia sólido: um tutor de IA que ajudava recém-chegados a praticar inglês usando cenários específicos de Vancouver. Pedir café no JJ Bean, pedir direções para o VCC, navegar uma conversa com um senhorio sobre contas da BC Hydro. Situações reais que eles realmente enfrentariam, alimentadas por GPT-4 com prompts personalizados que entendiam o contexto local.
Passei três semanas construindo essa coisa entre as corridas. Estacionado perto do YVR esperando por corridas para o aeroporto, programando fluxos de conversa. Sentado no McDonald's da Robson às 2 da manhã, treinando a IA em gírias e referências locais de Vancouver. O aplicativo conseguia gerar diálogos realistas sobre qualquer coisa, desde atrasos do SkyTrain até explicar a diferença entre Vancouver e North Vancouver para turistas confusos.
A implementação técnica era uma bagunça. Estou falando de gerenciamento de estado mantido por orações, um esquema de banco de dados que fazia sentido às 4 da manhã mas parecia arte abstrata durante sessões de debug diurnas. As respostas da IA eram inconsistentes — às vezes brilhantes, às vezes recomendando que os usuários praticassem inglês perguntando a estranhos sobre "as belas montanhas de Regina" ou sugerindo que pegassem o "metrô de Toronto para Stanley Park."
O dia do lançamento chegou. Postei no Reddit, compartilhei em alguns grupos do Facebook para recém-chegados, até convenci alguns passageiros a testá-lo. O feedback foi... educativo. Acontece que pessoas aprendendo inglês não querem praticar com uma IA que ocasionalmente esquece qual cidade deveria estar ajudando-as a navegar. Um usuário deixou um comentário que ainda me assombra: "O aplicativo me disse para praticar pedindo 'pizza estilo Vancouver.' Perguntei em três lugares. Ninguém sabe o que significa. O aplicativo também não sabe."
Total de usuários após dois meses: adoção mínima. Lições aprendidas: Talvez entenda seu mercado-alvo antes de construir soluções para ele.
Pivotando num Estacionamento
Fracasso de produto é diferente quando você está construindo entre corridas de Uber. Não há reunião de equipe para discutir próximos passos, nenhuma sessão de brainstorming para pivotar. Só eu, sentado do lado de fora do Cactus Club à 1 da manhã, olhando para o Google Analytics mostrando zero usuários ativos, tentando descobrir o que deu errado enquanto monitoro pedidos de corrida.
O pivot veio durante uma terça-feira particularmente lenta. Eu estava estacionado do lado de fora de um hotel no centro, vendo as métricas de engajamento do meu aplicativo de aprendizado de idiomas estagnarem, quando ouvi dois passageiros conversando sobre como era impossível encontrar bons criadores de conteúdo para o blog da startup deles. Eles precisavam de conteúdo técnico, precisavam rápido, e estavam dispostos a pagar bem por escrita de qualidade.
Momento de insight: E se eu construísse um assistente de escrita IA especificamente para conteúdo técnico? Não outra ferramenta genérica de escrita IA, mas algo feito sob medida para empresas SaaS, startups, desenvolvedores — pessoas que precisavam de conteúdo que não soasse como se tivesse sido escrito por um robô tentando atingir metas de palavras-chave de SEO.
Comecei a construir naquela noite. Novo repositório no GitHub, nova visão de produto, mesma tela de laptop rachada e postura horrível. Dessa vez fui mais esperto com a arquitetura — ou pelo menos pensei que fui. Design de API mais limpo, estrutura de banco de dados melhor, engenharia de prompts mais cuidadosa. A IA conseguia escrever posts de blog técnicos, documentação de API, descrições de produtos, até comentários de código que não soavam como se tivessem sido gerados por um gerador de números aleatórios particularmente verborrágico.
O Pesadelo Técnico que Ninguém Avisa
Construir produtos de IA como desenvolvedor solo é como ser uma orquestra de uma pessoa onde metade dos instrumentos está pegando fogo e a partitura muda no meio da apresentação. Cada integração quebra de um jeito diferente. Cada API tem sua própria maneira especial de falhar catastroficamente.
A API da OpenAI começava aleatoriamente a retornar respostas no que acho que era português, mas só para certos tipos de prompt, só às terças-feiras, só quando Mercúrio estava retrógrado. O Claude da Anthropic funcionava perfeitamente por semanas, então de repente desenvolvia opiniões fortes sobre não escrever material de marketing porque poderia ser "manipulador." Passei mais tempo gerenciando peculiaridades de APIs do que construindo funcionalidades reais.
Bancos de dados vetoriais são o inferno especial reservado para desenvolvedores independentes que acharam que armazenar embeddings seria simples. Pinecone funcionava muito bem até não funcionar mais. Weaviate tinha uma documentação linda que não se parecia em nada com como as coisas realmente funcionavam. Tentei construir minha própria solução de armazenamento vetorial e aprendi por que isso é uma má ideia mais ou menos na mesma época em que meu laptop começou a fazer barulhos preocupantes durante operações de indexação.
Os custos de infraestrutura estavam me consumindo vivo. Cada experimento, cada teste, cada vez que esquecia de adicionar limitação de taxa adequada — dinheiro voando da minha conta da AWS mais rápido do que eu conseguia ganhar dirigindo pela multidão noturna de Vancouver. Otimizei tudo que pude imaginar: modelos menores para tarefas simples, cache de respostas, engenharia de prompts agressiva para reduzir o uso de tokens. Ainda assim, queimando dinheiro em custos de computação enquanto minha receita real teimosamente permanecia em zero.
Encontrando Usuários em Lugares Inesperados
Marketing de um produto de IA do seu carro é surreal. Estou postando capturas de tela no Twitter enquanto espero em semáforos vermelhos, respondendo a comentários no Hacker News entre embarques de passageiros, tentando construir uma audiência de clientes em potencial enquanto meu trabalho principal envolve dirigir pessoas que não fazem ideia de que estou fazendo bicos como empreendedor de tecnologia.
O avanço veio de uma fonte inesperada: meus passageiros do Uber. Comecei a mencionar minha ferramenta de escrita IA para qualquer um que parecesse trabalhar com tecnologia. O cenário de startups de Vancouver é surpreendentemente pequeno, e aparentemente todo mundo conhece todo mundo. Uma cientista de dados que levei de um coworking no centro para o YVR experimentou minha ferramenta e amou. Ela me apresentou à equipe de marketing da startup dela. Eles se tornaram meus primeiros clientes pagantes.
O boca a boca se espalhou organicamente pela comunidade tech de Vancouver. Conversas em cafeterias, eventos de networking que não pude comparecer porque estava dirigindo, grupos no Slack onde meus primeiros usuários compartilhavam minha ferramenta com seus colegas. Eu não estava escalando por canais de marketing tradicionais — estava crescendo através da interseção estranha de ride-sharing e networking de tecnologia que só existe em cidades como Vancouver, onde todo mundo está conectado por uns dois graus de separação.
A receita começou a entrar aos poucos: valores modestos no primeiro mês, crescendo consistentemente nos meses seguintes. Não é dinheiro que muda a vida, mas o suficiente para cobrir minhas contas da AWS e comprar café melhor para aquelas sessões de debug às 3 da manhã. Mais importante, as pessoas estavam realmente usando o que eu construí. A IA estava gerando conteúdo que empresas reais estavam publicando, conteúdo que não soava como se viesse de uma fábrica de conteúdo ou de otimização de palavras-chave.
A Armadilha da Validação
O sucesso é perigoso quando você está construindo sozinho. Aquele primeiro gostinho de receita, aquelas primeiras avaliações positivas de usuários, a satisfação de ver seu código realmente resolver problemas reais — é intoxicante. Comecei a achar que tinha descoberto tudo, que tinha decifrado o código do desenvolvimento de produtos de IA sentado no meu Honda Civic.
Fiquei arrogante. Comecei a planejar o Produto Três antes de ter escalado adequadamente o Produto Dois. Comecei a esboçar algum sistema ambicioso de gerenciamento de conteúdo alimentado por IA que revolucionaria como pequenas empresas lidavam com todo o pipeline de conteúdo delas. O aumento de escopo era real e era espetacular.
Enquanto isso, meus usuários existentes estavam pedindo funcionalidades básicas que eu não tinha construído: melhor organização de conteúdo, ferramentas de colaboração, integrações com plataformas que eles realmente usavam. Em vez de ouvir, eu estava perseguindo a próxima capacidade brilhante de IA, tentando construir algo tecnicamente impressionante em vez de algo genuinamente útil.
O alerta veio durante uma conversa particularmente honesta com meu maior cliente, uma startup que me pagava significativamente pela geração de conteúdo deles. Eles amavam a qualidade da saída da IA, mas a ferramenta em si era desajeitada e carecia de funcionalidades óbvias. Eles estavam copiando conteúdo para o Google Docs para compartilhar com a equipe, rastreando manualmente o que tinham gerado, mantendo planilhas de ideias de conteúdo porque meu produto não lidava com nenhum desse fluxo de trabalho.
Construindo o Que as Pessoas Realmente Querem
Aquela sessão de feedback mudou tudo. Parei de trabalhar na grande visão e comecei a consertar os problemas chatos que meus usuários reais enfrentavam todos os dias. Melhor organização de arquivos, colaboração em equipe, calendários de conteúdo, análises de uso que faziam sentido. Não eram funcionalidades sexy, nem avanços em IA, apenas desenvolvimento de produto sólido que tornava a vida das pessoas marginalmente mais fácil.
O trabalho técnico era menos interessante, mas mais importante. Construir autenticação de usuário adequada, implementar compartilhamento de arquivos, criar visualizações de painel que carregavam em menos de três segundos. Passei mais tempo otimizando consultas de banco de dados do que treinando modelos de IA, mais tempo em melhorias de UX do que em avanços de engenharia de prompts.
A receita cresceu consistentemente mês a mês. Ainda não o suficiente para largar o Uber, mas o suficiente para começar a pensar em como seria essa transição. Meus usuários estavam ficando, atualizando para níveis mais altos, indicando colegas. O produto estava se tornando genuinamente útil em vez de apenas tecnicamente engenhoso.
A Longa Estrada pela Frente
Ainda estou dirigindo Uber, ainda construindo produtos de IA entre as corridas, ainda debugando problemas de deploy em estacionamentos por todo Vancouver. Mas algo mudou. Isso não é mais apenas um "bico" — está se tornando um negócio real, lenta e desordenadamente, e de maneiras que nunca esperei.
O ecossistema de IA ainda está se movendo mais rápido do que consigo acompanhar. Novos modelos, novas capacidades, novos concorrentes lançando toda semana. Mas estou começando a entender que o sucesso não é ter a IA mais avançada ou as funcionalidades mais inovadoras. É resolver problemas reais para pessoas reais, de forma consistente e confiável, mesmo que seu ambiente de desenvolvimento seja o banco da frente de um Honda Civic 2018.
Ainda há um longo caminho pela frente. A receita precisa crescer substancialmente antes que eu possa parar de dirigir à noite. O roteiro do produto está cheio de funcionalidades que parecem óbvias em retrospecto, mas exigem semanas de tempo de desenvolvimento que estou roubando do sono e da vida social. A concorrência está aumentando, e startups financiadas por VC estão construindo ferramentas semelhantes com equipes de desenvolvedores experientes e orçamentos de marketing que ofuscam minha renda anual.
Mas ainda estou aqui, ainda construindo, ainda convencido de que iniciar uma empresa de IA do seu carro é de alguma forma um caminho de carreira viável. Talvez eu seja delirante. Talvez todo esse experimento acabe espetacularmente e eu esteja dirigindo Uber pelos próximos cinco anos. Ou talvez, apenas talvez, eu descubra como transformar sessões de codificação tarde da noite e conversas com clientes em algo que se pareça com um negócio real. De qualquer forma, estarei documentando cada erro, cada pequena vitória, cada momento de questionamento se tudo isso faz sentido. Porque se há uma coisa que aprendi construindo produtos de IA entre corridas de Uber, é que a jornada é mais estranha e mais educativa do que qualquer resultado que eu poderia ter planejado.
Создание AI-продуктов между поездками Uber: Мой бредовый дневник разработчика
Уже за полночь, я сижу в своей Honda Civic у магазина bubble tea на Commercial Drive и смотрю, как батарея ноутбука медленно садится, пока я отлаживаю самую позорную интеграцию API в своей жизни. Пьяные студенты, которых я высадил пять минут назад, расплатились наличными и, спотыкаясь, направились к тому, что, как я предполагаю, было их общежитием, оставив меня наедине с моими мыслями и кодовой базой, которая больше похожа на спагетти, чем на программное обеспечение. Такова теперь моя жизнь: водитель Uber в Ванкувере ночью, начинающий AI-предприниматель в затишье между пиковыми часами.
Шесть месяцев назад у меня не было никакого опыта в AI и диплом по компьютерным наукам, который я не использовал. Теперь у меня есть три наполовину готовых AI-продукта, GitHub, полный заброшенных репозиториев, и столько отказов от инвесторов, что ими можно оклеить стены моей студии в Бернаби. Но я всё ещё здесь, всё ещё создаю, всё ещё убеждаю себя, что следующий деплой станет тем самым, который всё изменит.
Суровая реальность, о которой никто не говорит
Все в Twitter представляют независимую AI-разработку гламурной. Выложи скриншот панели доходов, поделись вдохновляющей цитатой о создании на публику, наблюдай, как набегают лайки. Реальность уродливее. Я создаю продукты на парковках Tim Hortons в 3 часа ночи, потому что именно тогда туристы перестают заказывать поездки, и у меня наконец-то есть время писать код.
Моя текущая установка плачевна: MacBook Pro 2019 года с треснувшим экраном, телефонная точка доступа для интернета, которая отключается каждый раз, когда проезжает автобус, и автомобильное сиденье, не предназначенное для того, чтобы человек проводил восемь часов, отлаживая скрипты Python. Моя спина permanently искривлена от горбатого положения над ноутбуком в тесных пространствах, и я запомнил все круглосуточные кофейни между центром города и Ричмондом, потому что это единственные места с надежным WiFi и туалетами.
Экосистема AI-разработки движется так быстро, что любой туториал, который я добавляю в закладки, устаревает ещё до того, как я дочитываю его до конца. OpenAI выпускает новую модель, Anthropic обновляет свой API, Google объявляет о чём-то, что делает всё, над чем я работаю, потенциально неактуальным. Я постоянно перестраиваю одни и те же функции, потому что базовая технология изменилась, пока я развозил пьяных людей домой с Granville Street.
Продукт Первый: Катастрофа с изучением языка
Мой первый AI-продукт должен был произвести революцию в изучении языка для иммигрантов в Ванкувере. Потому что что может лучше демонстрировать "понимание своего рынка", чем парень, который говорит только по-английски, создающий инструменты для людей, изучающих английский, верно?
Концепция казалась надежной: AI-репетитор, помогающий новичкам практиковать английский на основе реальных ситуаций в Ванкувере. Заказать кофе в JJ Bean, спросить дорогу до VCC, поддержать разговор с арендодателем о счетах BC Hydro. Реальные ситуации, с которыми они столкнутся, работающие на GPT-4 с пользовательскими промптами, учитывающими местный контекст.
Я потратил три недели на создание этой штуки между поездками. Стоял на парковке возле YVR в ожидании заказов в аэропорт, программируя диалоговые сценарии. Сидел в McDonald's на Robson в 2 часа ночи, обучая AI ванкуверскому сленгу и местным отсылкам. Приложение могло генерировать реалистичные диалоги о чём угодно: от задержек SkyTrain до объяснения разницы между Ванкувером и Северным Ванкувером сбитым с толку туристам.
Техническая реализация была кошмаром. Я говорю об управлении состоянием, держащемся на молитве, схеме базы данных, которая имела смысл в 4 утра, но днём при отладке выглядела как абстрактное искусство. Ответы AI были непоследовательны — иногда блестящие, иногда рекомендующие пользователям практиковать английский, спрашивая незнакомцев о "красивых горах Regina" или предлагающие им сесть на "метро Торонто до Stanley Park".
Наступил день запуска. Я опубликовал пост на Reddit, поделился в некоторых группах для новичков в Facebook, даже убедил нескольких пассажиров попробовать приложение. Обратная связь была... поучительной. Оказалось, что люди, изучающие английский, не хотят практиковаться с AI, который иногда забывает, в каком городе он должен помогать им ориентироваться. Один пользователь оставил отзыв, который до сих пор меня преследует: "Приложение сказало мне практиковать заказ 'Vancouver-style pizza'. Я спросил в трёх местах. Никто не знает, что это значит. Приложение тоже не знает."
Всего пользователей через два месяца: минимальное количество. Уроки усвоены: Возможно, стоит понимать свою целевую аудиторию, прежде чем создавать для неё решения.
Поворот на парковке
Провал продукта ощущается иначе, когда ты создаёшь между поездками Uber. Нет командных собраний, чтобы обсудить следующие шаги, нет мозговых штурмов для поиска новых направлений. Только я, сидящий возле Cactus Club в час ночи, смотрящий на Google Analytics, показывающий ноль активных пользователей, и пытающийся понять, что пошло не так, одновременно отслеживая запросы на поездки.
Поворот произошёл во время особенно скучного вечера вторника. Я был припаркован возле отеля в центре города, наблюдая, как показатели вовлеченности моего приложения для изучения языка падают, когда я случайно услышал, как двое пассажиров обсуждали, как невозможно найти хороших создателей контента для блога их стартапа. Им нужен был технический контент, нужен был быстро, и они были готовы хорошо платить за качественные тексты.
Момент озарения: Что, если я создам AI-ассистента для написания именно технического контента? Не очередной универсальный инструмент для написания текстов, а что-то, специально созданное для SaaS-компаний, стартапов, разработчиков — людей, которым нужен контент, не звучащий так, будто его написал робот, пытающийся попасть в SEO-ключевые слова.
Я начал создавать его той же ночью. Новая репа на GitHub, новое видение продукта, тот же треснувший экран ноутбука и ужасная осанка. На этот раз я был умнее в архитектуре — или, по крайней мере, мне так казалось. Более чистый дизайн API, лучшая структура базы данных, более продуманный промпт-инжиниринг. AI мог писать технические посты для блогов, документацию API, описания продуктов и даже комментарии к коду, которые не звучали так, будто их сгенерировал особенно многословный генератор случайных чисел.
Технический кошмар, о котором вас никто не предупреждает
Создание AI-продуктов в одиночку — это как быть оркестром из одного человека, где половина инструментов горит, а ноты постоянно меняются прямо во время выступления. Каждая интеграция ломается по-своему. У каждого API свой особый способ катастрофически отказывать.
API OpenAI мог случайно начать возвращать ответы на том, что я думал, было португальским, но только для определённых типов промптов, только по вторникам, только когда Меркурий в ретрограде. Anthropic Claude мог работать идеально неделями, а потом внезапно начать возражать против написания маркетинговых текстов, потому что это может быть "манипулятивным". Я тратил больше времени на управление капризами API, чем на создание реальных функций.
Векторные базы данных — это особый ад, припасённый для независимых разработчиков, которые думали, что хранить эмбеддинги будет просто. Pinecone работал отлично, пока не переставал. Weaviate имел прекрасную документацию, которая не имела никакого отношения к тому, как всё работало на самом деле. Я попытался создать своё собственное решение для хранения векторов и понял, почему это плохая идея, примерно в то же время, когда мой ноутбук начал издавать подозрительные звуки во время операций индексации.
Инфраструктурные расходы съедали меня заживо. Каждый эксперимент, каждый тест, каждый раз, когда я забывал добавить правильное ограничение скорости — деньги улетали с моего счета AWS быстрее, чем я мог заработать их, развозя ночную публику Ванкувера. Я оптимизировал всё, что мог придумать: модели поменьше для простых задач, кэширование ответов, агрессивный промпт-инжиниринг для уменьшения использования токенов. Всё равно сжигал деньги на вычислительные мощности, в то время как мой фактический доход упрямо оставался на нуле.
Поиск пользователей в неожиданных местах
Маркетинг AI-продукта из машины — это сюрреалистично. Я публикую скриншоты в Twitter, ожидая на светофорах, отвечаю на комментарии на Hacker News между посадками пассажиров, пытаюсь собрать аудиторию потенциальных клиентов, пока моя основная работа — развозить людей, которые понятия не имеют, что я подрабатываю технологическим предпринимателем.
Прорыв пришёл из неожиданного источника: мои пассажиры Uber. Я начал упоминать свой инструмент для написания текстов всем, кто выглядел как работник IT-сферы. Стартап-сцена Ванкувера на удивление мала, и, судя по всему, все знают друг друга. Специалист по данным, которую я отвёз из коворкинга в центре в YVR, попробовала мой инструмент, и он ей очень понравился. Она познакомила меня с маркетинговой командой своего стартапа. Они стали моими первыми платящими клиентами.
Сарафанное радио распространялось органично через IT-сообщество Ванкувера. Разговоры в кофейнях, нетворкинг-мероприятия, на которые я не мог пойти, потому что был за рулём, Slack-группы, где мои первые пользователи делились моим инструментом с коллегами. Я масштабировался не через традиционные маркетинговые каналы — я рос через странное пересечение райдшеринга и IT-нетворкинга, которое существует только в таких городах, как Ванкувер, где все связаны буквально парой степеней разделения.
Доход начал поступать по капле: скромные суммы в первый месяц, стабильно растущие в последующие. Не деньги, меняющие жизнь, но достаточно, чтобы покрыть счета за AWS и покупать лучший кофе для тех 3-часовых сессий отладки. Что ещё важнее, люди действительно использовали то, что я создал. AI генерировал контент, который реальные компании публиковали, контент, который не звучал так, будто он из контент-фабрики или фабрики по наполнению ключевыми словами.
Ловушка валидации
Успех опасен, когда ты работаешь в одиночку. Этот первый вкус дохода, те первые положительные отзывы пользователей, удовлетворение от того, что твой код действительно решает реальные проблемы — это опьяняет. Я начал думать, что всё понял, что разгадал код разработки AI-продуктов, сидя в своей Honda Civic.
Я стал самоуверенным. Начал планировать Продукт Третий, не успев как следует масштабировать Продукт Второй. Начал набрасывать амбициозную AI-систему управления контентом, которая должна была произвести революцию в том, как малый бизнес управляет всей своей контентной цепочкой. Расширение объёма было реальным и грандиозным.
Тем временем мои существующие пользователи просили базовых функций, которые я не создал: лучшую организацию контента, инструменты для совместной работы, интеграции с платформами, которые они реально использовали. Вместо того чтобы слушать, я гнался за следующей блестящей AI-возможностью, пытаясь создать нечто технически впечатляющее, а не по-настоящему полезное.
Момент пробуждения наступил во время особенно откровенного разговора с моим самым крупным клиентом, стартапом, который платил мне приличные деньги за генерацию контента. Им нравилось качество выводов AI, но сам инструмент был неудобным и в нём не хватало очевидных функций. Они копировали контент в Google Docs, чтобы делиться им с командой, вручную отслеживали, что сгенерировали, вели таблицы с идеями для контента, потому что мой продукт не поддерживал ни один из этих рабочих процессов.
Создание того, что людям действительно нужно
Этот сессия обратной связи всё изменила. Я перестал работать над грандиозным видением и начал исправлять скучные проблемы, с которыми мои реальные пользователи сталкивались каждый день. Лучшая организация файлов, командная работа, контент-календари, осмысленная аналитика использования. Не сексуальные функции, не прорывы в AI, а просто качественная разработка продукта, которая делала жизнь людей немного проще.
Техническая работа была менее интересной, но более важной. Создание правильной аутентификации пользователей, реализация обмена файлами, создание панелей управления, которые загружались менее чем за три секунды. Я тратил больше времени на оптимизацию запросов к базе данных, чем на обучение AI-моделей, больше времени на улучшения UX, чем на прорывы в промпт-инжиниринге.
Доход стабильно рос месяц за месяцем. Всё ещё недостаточно, чтобы уйти из Uber, но достаточно, чтобы начать думать о том, как может выглядеть этот переход. Мои пользователи оставались, переходили на более высокие тарифы, рекомендовали коллегам. Продукт становился по-настоящему полезным, а не просто технически хитроумным.
Долгий путь впереди
Я всё ещё вожу Uber, всё ещё создаю AI-продукты между поездками, всё ещё отлаживаю проблемы с деплоем на парковках по всему Ванкуверу. Но что-то изменилось. Это больше не просто подработка — это становится настоящим бизнесом, медленно, неаккуратно и так, как я никогда не ожидал.
Экосистема AI всё ещё движется быстрее, чем я успеваю за ней. Новые модели, новые возможности, новые конкуренты запускаются каждую неделю. Но я начинаю понимать, что успех не в том, чтобы иметь самый продвинутый AI или самые инновационные функции. Он в том, чтобы решать реальные проблемы для реальных людей, последовательно и надёжно, даже если твоя среда разработки — это переднее сиденье Honda Civic 2018 года.
Впереди ещё долгий путь. Доход должен существенно вырасти, прежде чем я смогу перестать работать ночами. Дорожная карта продукта полна функций, которые кажутся очевидными задним умом, но требуют недель времени на разработку, которое я краду у сна и социальной жизни. Конкуренция растёт, и стартапы на венчурном финансировании создают похожие инструменты с командами опытных разработчиков и маркетинговыми бюджетами, которые затмевают мой годовой доход.
Но я всё ещё здесь, всё ещё создаю, всё ещё убеждён, что создание AI-компании на коленке из машины — это каким-то образом жизнеспособный карьерный путь. Может быть, я брежу. Может быть, весь этот эксперимент эффектно провалится, и я буду водить Uber следующие пять лет. Или, может быть, я разберусь, как превратить ночные сессии программирования и разговоры с клиентами в то, что напоминает настоящий бизнес. В любом случае, я буду документировать каждую ошибку, каждую маленькую победу, каждый момент сомнений в том, имеет ли всё это смысл. Потому что, если я чему-то и научился, создавая AI-продукты между поездками Uber, так это тому, что этот путь страннее и поучительнее любого результата, который я мог бы запланировать.
在优步接单间隙构建AI产品:我的妄想型开发者日记
午夜已过,我坐在本田思域里,停在Commercial Drive一家奶茶店外,看着笔记本电脑的电量一点点耗尽,同时调试着这辈子最尴尬的API集成故障。五分钟前下车的几位醉醺醺的大学生付了现金,跌跌撞撞地走向我猜是宿舍的地方,留下我和我的思绪,还有一堆比软件更像意大利面的代码。这就是我现在的生活:白天是温哥华的优步司机,晚上是趁着打车高峰间隙的AI创业梦想家。
六个月前,我毫无AI经验,只有一张没用上的计算机科学学位。现在,我有三个半成品AI产品、一个装满废弃仓库的GitHub,以及足够糊满本拿比单身公寓墙壁的投资人拒信。但我还在坚持,还在构建,还在说服自己下一次部署将改变一切。
没人在意的现实考验
推特上的每个人都在把独立AI开发包装得光鲜亮丽。贴一张收入仪表盘的截图,分享一句关于公开构建的名言,然后坐等点赞。现实要丑陋得多。我凌晨三点在Tim Hortons停车场写代码,因为那时候游客们不再叫车,我终于有时间写代码了。
我现在的装备可怜得很:一台屏幕破裂的2019款MacBook Pro,用手机热点联网,每当有公交车经过网络就会断掉,还有一把根本不适合人类连续八小时调试Python脚本的座椅。我的背因为长期蜷缩在狭小空间里盯着笔记本电脑而永久性扭曲。我记住了从市中心到列治文之间每一家24小时营业的咖啡馆,因为它们是唯一拥有可靠WiFi和洗手间的地方。
AI开发生态系统变化太快,以至于我收藏的任何教程还没读完就已经过时了。OpenAI发布新模型,Anthropic更新API,Google宣布了可能让我正在做的一切都变得无关紧要的东西。我不断重建同一个功能,因为底层技术在我开车送醉汉从Granville Street回家的功夫就变了。
产品一:语言学习大灾难
我的第一个AI产品本应彻底改变温哥华移民的语言学习方式。一个只会说英语的家伙为学英语的人构建语言工具,这简直是在说"了解你的市场"啊,对吧?
这个想法看起来挺靠谱:一个AI家教,帮助新移民练习英语,但用的是温哥华本地场景。在JJ Bean点咖啡,问路去VCC,与房东讨论BC Hydro账单。他们实际会遇到的真实现状,由GPT-4驱动,配合了解本地语境的定制提示词。
我花了三周时间在接单间隙构建这个东西。在YVR外等机场单时,编写对话流程。凌晨两点坐在Robson街的麦当劳里,训练AI识别温哥华俚语和本地梗。这个应用可以生成关于任何话题的逼真对话,从SkyTrain延误到向困惑的游客解释温哥华与北温哥华的区别。
技术实现简直一团糟。状态管理全靠祈祷支撑,数据库架构在凌晨四点看起来合理,但白天调试时就变成了抽象艺术。AI的回复时好时坏——有时很出色,有时却建议用户通过向陌生人询问"美丽的里贾纳山脉"来练习英语,或者建议他们乘坐"多伦多地铁去Stanley Park"。
发布日到了。我在Reddit上发帖,在面向新移民的Facebook群组里分享,甚至说服了几位乘客试用。反馈……很有教育意义。原来正在学英语的人并不想和一个时不时忘记该帮他们导航哪个城市的AI练习。一位用户留下的评论至今让我耿耿于怀:"应用让我练习点'温哥华风格披萨'。我去三家店问了。没人知道这是什么意思。应用也不知道。"
两个月后的总用户数:少得可怜。学到的教训:在为他们构建解决方案之前,或许先了解你的目标市场。
在停车场转型
当你在优步接单间隙构建产品时,产品失败的感觉是不同的。没有团队会议讨论下一步,没有白板会议来头脑风暴转型方案。只有我,凌晨一点坐在Cactus Club外面,盯着Google Analytics上零活跃用户的数据,边监控叫车请求边琢磨哪里出了问题。
转型发生在某个特别冷清的周二晚上。我停在市中心一家酒店外,看着我那个语言学习应用的用户参与度曲线一蹶不振,这时我无意中听到两位乘客在讨论,说为他们的初创公司博客找到优秀的内容创作者有多难。他们需要技术内容,需要快速拿到,而且愿意为高质量的写作支付高价。
灵光一现:如果我构建一个专门用于技术内容的AI写作助手呢?不是又一个普通的AI写作工具,而是专门为SaaS公司、初创公司、开发者设计的——那些需要听起来不像是由一个试图凑SEO关键词的机器人写出来的内容的人。
我那天晚上就开始构建了。新的GitHub仓库,新的产品愿景,还是那台屏幕破裂的笔记本电脑和糟糕的姿势。这次我在架构上更聪明了——至少我是这么想的。更干净的API设计,更好的数据库结构,更周到的提示词工程。这个AI可以写技术博客文章、API文档、产品描述,甚至代码注释——这些注释听起来不再像是一个特别啰嗦的随机数生成器生成的。
没人警告你的技术噩梦
作为独立开发者构建AI产品,就像是一个人指挥一支管弦乐队,但一半的乐器着火了,乐谱还在演奏中途不断变化。每个集成都以不同的方式崩溃。每个API都有自己独特的灾难性失败方式。
OpenAI的API会随机开始返回我以为是什么葡萄牙语的回复——但仅限于某些提示类型,仅限于周二,仅限于水星逆行的时候。Anthropic的Claude会完美运行几周,然后突然对写营销文案产生强烈抵触,认为这可能是"操纵性的"。我花在管理API古怪行为上的时间比构建实际功能还多。
向量数据库是留给那些以为存储嵌入会很简单独立开发者的专属地狱。Pinecone一直好用,直到突然不好用了。Weaviate有漂亮的文档,但与实际运行情况毫无关系。我尝试构建自己的向量存储方案,然后在笔记本电脑在索引操作期间开始发出可疑噪音时,明白了为什么这是个坏主意。
基础设施成本正在吃掉我。每次实验、每次测试、每次我忘记添加适当的速率限制——钱从我的AWS账户飞出去的速度,比我开车接送温哥华深夜人群赚钱的速度还快。我优化了能想到的一切:简单任务用小模型,响应缓存,激进的提示词工程以减少token消耗。但计算成本仍在烧钱,而我的实际收入仍然顽固地停留在零。
在意外的地方找到用户
从你的车里营销一个AI产品很超现实。我在等红灯时在推特上发截图,在乘客接送的间隙回复Hacker News的评论,试图建立一个潜在客户群,而我的主要工作却是在开车接送一群完全不知道我在兼职做科技创业者的人。
突破来自一个意想不到的来源:我的优步乘客。我开始向任何看起来做科技行业的人提起我的AI写作工具。温哥华的初创圈出奇地小,而且显然每个人都认识每个人。一位我开车从市中心共享办公空间送到YVR的数据科学家试用了我的工具,非常喜欢。她把我介绍给了她初创公司的营销团队。他们成为了我的第一批付费客户。
口碑在温哥华的科技圈自然传播开来。咖啡馆里的交谈,我因为开车而无法参加的社交活动,早期用户在与同事分享我工具的Slack群组。我不是通过传统的营销渠道扩展——我是通过拼车与科技社交的奇异交汇点成长起来的,这种交汇点只存在于像温哥华这样的城市,这里每个人都隔着大约两度人脉关系。
收入开始涓涓流入:第一个月数额不大,随后几个月稳步增长。不是能改变生活的钱,但足以支付我的AWS账单,并为凌晨三点的调试会话买更好的咖啡。更重要的是,人们真的在使用我构建的东西。AI正在生成真实公司正在发布的内容,这些内容听起来不像来自内容农场或关键词堆砌工厂。
验证陷阱
当你独自构建时,成功是危险的。第一次尝到收入的甜头,那些最初的正面用户评价,看到你的代码真正解决实际问题的满足感——这令人陶醉。我开始以为我摸索出了门道,以为我坐在本田思域里就破解了AI产品开发的密码。
我变得自大了。在第二款产品还没好好扩展之前,就开始规划第三款产品。开始勾勒一个雄心勃勃的AI驱动内容管理系统,据说它会彻底改变小企业处理整个内容管线的方式。范围蔓延是真真切切的,而且非常壮观。
与此同时,我现有的用户正在要求我还没构建的基础功能:更好的内容组织、协作工具、与他们实际使用的平台集成。我没有倾听,而是在追逐下一个闪亮的AI能力,试图构建技术上令人印象深刻的东西,而不是真正有用的东西。
警钟是在与我的最大客户——一家为我支付可观费用的初创公司——进行了一次特别坦诚的对话时敲响的。他们喜欢AI的输出质量,但工具本身很笨拙,缺少明显的功能。他们要把内容复制到Google Docs才能与团队分享,手动跟踪生成的内容,用电子表格记录内容创意,因为我的产品完全没有处理这些工作流程。
构建人们真正想要的东西
那次反馈会议改变了一切。我不再致力于宏大的愿景,而是开始修复实际用户每天面对的枯燥问题。更好的文件组织、团队协作、内容日历、有意义的用量分析。不是性感的功能,不是AI突破,只是扎实的产品开发,让人们的生活稍微轻松一点。
技术工作变得没那么有趣了,但更重要。构建合适的用户认证,实现文件共享,创建三秒内加载的仪表盘视图。我花在优化数据库查询上的时间比训练AI模型还多,花在UX改进上的时间比提示词工程突破还多。
收入逐月稳步增长。仍然不足以让我辞掉优步的工作,但足以开始思考这个转变可能是什么样子。我的用户在留下来,升级到更高层级,推荐给同事。这个产品正在变得真正有用,而不仅仅是技术上巧妙。
前路漫漫
我还在开优步,还在接单间隙构建AI产品,还在温哥华各地的停车场调试部署问题。但有些事情变了。这不再只是一个副业——它正在成为一个真正的生意,缓慢而混乱,以我从未预料过的方式发展着。
AI生态系统的变化速度仍然快过我能够跟上的速度。新模型、新能力、新竞争者每周都在出现。但我开始明白,成功不在于拥有最先进的AI或最具创新性的功能。而在于持续可靠地为真实的人解决真实的问题,即使你的开发环境是一辆2018款本田思域的前座。
路还很长。收入需要大幅增长,我才能不再开夜车。产品路线图上满是那些事后看来很明显、但却需要花费数周开发时间的功能——这些时间是我从睡眠和社交生活中偷来的。竞争在加剧,VC支持的初创公司正在用经验丰富的开发团队和比我年收入还多的营销预算构建类似的工具。
但我还在坚持,还在构建,还在相信从车里白手起家创办一家AI公司是某种可行的职业道路。也许我是妄想。也许整个实验会壮观地失败,而我将在未来五年里继续开优步。又或者,也许我能找到方法,将深夜写代码的时光和与客户的对话,转变成一个看起来像真正生意的东西。无论如何,我会记录每一个错误、每一次小小的胜利、每一次质疑这一切是否有意义的时刻。因为如果说我从优步接单间隙构建AI产品中学到了一件事,那就是这段旅程比我所能计划出的任何结果都更离奇、更富有教育意义。
Get new posts
Subscribe in your language
New posts delivered to your inbox. Unsubscribe anytime.
Receive in: