AI, które rozwiązuje realne problemy… czyli kolorowanki dla dzieci!
🎨 AI, które rozwiązuje realne problemy… czyli kolorowanki dla dzieci!
Zawsze byłem fanem AI, jednak zdecydowanie sprzeciwiam się szukaniu problemu pod narzędzie na zasadzie: „ZRÓBMY COŚ W AI”. No i przyszedł ten dzień, kiedy problem znalazł się sam…
Żona na studiach podyplomowych, ja mam “dyżur” z dziećmi, a one bombardują mnie prośbami o kolorowanki. I to nie byle jakie: “Tata, wydrukuj mi X na Y”. Wtedy zapaliła się lampka: przecież to można zautomatyzować!
I tu AI okazało się niezbędne:
- Do zmiany mowy na tekst (dzieciaki nie piszą).
- Do wygenerowania samych kolorowanek.
- Do zaprogramowania całości… w specyficznych warunkach.
🎬 Demo
👨💻 Vibe Coding
Tradycyjne „kraftowe” programowanie wymaga 100% skupienia, co przy dzieciach jest niemożliwe. Jedyne wyjście to Vibe Coding:
- ⏱️ 30 sekund promptowania.
- 👶 Powrót do dzieciaków i czekanie na wygenerowaną funkcjonalność.
- 🔄 Cykl powtórzony X razy.
📝 Komercyjnym odpowiednikiem dzieci mogą być spotkania na Zoomie. Przy dużej ich liczbie Vibe Coding może być jedynym wyjściem 😉
🎨 Co robi aplikacja?
- Dziecko klika mikrofon i mówi, co chce pokolorować.
- AI zamienia mowę na tekst (i opcjonalnie “upiększa” prompt).
- Apka dorzuca do promptu zdjęcia referencyjne (np. członków rodziny z dedykowanego folderu).
- Wysyła request o kolorowankę, np. „Wiktor na Charizardzie”, „mama walcząca z Harrym Potterem”, „przypadkowy polityk kradnący coś z Ikea”.
- Obrazek leci prosto na drukarkę.
🛠️ Testowane narzędzia CLI
- 🥇 Codex (OpenAI): Po prostu robił robotę. Bez zbędnego gadania, implementacje prawie zawsze działały. Co ciekawe, często widziałem, jak „myśląc” odpalał sobie lokalnie skrypty w Pythonie, żeby lepiej rozwiązać problem (mimo że apka była w TypeScripcie).
- 🥈 Claude Code: Też całkiem nieźle, ale mam wrażenie, że chciał zrobić za dużo. Często dopytywał, dyskutował, a czasem przez to „wysypywał” apkę.
- 🥉 Gemini (CLI): Nie wiem, czy udało mi się z nim dowieźć choć jedną funkcjonalność. Często myślał w nieskończoność, a jego kod wymagał poprawek (przez inne narzędzia).
Copilot też był w grze, ale przy zadaniach wymagających pełnego kontekstu aplikacji radził sobie gorzej niż narzędzia CLI (dodam, że korzystałem z darmowej wersji, więc modele były słabsze).
🤔 Przemyślenia
- Ważne jest częstsze commitowanie. W narzędziach CLI “cofnij” nie jest tak proste jak w Copilocie.
- Wybór modelu to podstawa. Początkowo używałem OpenAI do generowania obrazów… i to była tragedia (kolorowanki słabe, nie trzymały referencji, nie pozwalały na generowanie postaci z bajek jak np. Pokemonów).
- Dużo mniej bolało usuwanie kodu wygenerowanego przez AI niż własnego, „dopieszczonego” dzieła, które okazywało się ślepą uliczką (patrz punkt wyżej).