🎨 Generator Kolorowanek
Aplikacja webowa, która zamienia głosowe pomysły dzieci w gotowe do wydruku kolorowanki. Wykorzystuje sztuczną inteligencję do rozpoznawania mowy, ulepszania promptów i generowania ilustracji, z możliwością automatycznego dołączania obrazów referencyjnych (np. członków rodziny).
Jak działa aplikacja
- Dziecko klika mikrofon i mówi, co chce pokolorować.
- AI zamienia mowę na tekst (i opcjonalnie “upiększa” prompt).
- Apka dorzuca do promptu zdjęcia referencyjne (np. członków rodziny z dedykowanego folderu).
- Wysyła request o kolorowankę, np. “Wiktor na Charizardzie”, “mama walcząca z Harrym Potterem”, “przypadkowy polityk kradnący coś z Ikea”.
- Obrazek leci prosto na drukarkę.
🎬 Demo
Desktop

Mobile

✨ Funkcjonalność
Prompty głosowe
Dzieci mogą nagrać swoją prośbę przez mikrofon lub wybrać gotową sugestię. Aplikacja automatycznie transkrybuje mowę na tekst za pomocą OpenAI Whisper.
Sugestie
Dzieci mogą wybrać gotową sugestię. Są one losowane, aby za każdym razem czymś zaskoczyć.
Inteligentne ulepszanie promptów
AI (GPT) automatycznie rozszerza i wzbogaca prosty prompt dziecka, aby stworzyć bardziej szczegółową i ciekawą kolorowankę.
Obrazy referencyjne
Najciekawsza funkcja - aplikacja automatycznie wykrywa i dołącza zdjęcia referencyjne z dedykowanego folderu (np. zdjęcia członków rodziny, zwierząt domowych), dzięki czemu kolorowanka może przedstawiać “mamę walczącą z Harrym Potterem” czy “Wiktora na Charizardzie”.
Tryb poziomy i pionowy
Możliwość wyboru orientacji obrazu (proporcje 2:3 lub 3:2) w zależności od typu kolorowanki.
Automatyczne drukowanie
Opcja bezpośredniego wysłania wygenerowanej kolorowanki na drukarkę IPP, idealne dla szybkiego workflow z dziećmi.
Historia i przeglądanie
Wszystkie wygenerowane kolorowanki są zapisywane z metadanymi, co pozwala na późniejsze przeglądanie i ponowne drukowanie ulubionych projektów.
🖼️ Przykłady kolorowanek





🧱 Architektura
Backend
Full-stack aplikacja oparta na TypeScript i Express, która integruje:
- Gemini - generowanie czarno-białych ilustracji idealnych do kolorowania
- OpenAI Whisper - transkrypcja nagrań głosowych na tekst
- OpenAI GPT - ulepszanie promptów i inteligentne wykrywanie pasujących obrazów referencyjnych
- IPP (Internet Printing Protocol) - bezpośrednie drukowanie na drukarkach sieciowych
Frontend
Interfejs użytkownika zbudowany w React z Vite i Material-UI, zapewniający responsywny design działający na desktopach i urządzeniach mobilnych.
Deployment
Aplikacja jest w pełni konteneryzowana z Docker Compose, co umożliwia łatwe uruchomienie obu serwisów jedną komendą.