Przejdź do treści
Home Blog Projekty O mnie

Generator Kolorowanek

🎨 Generator Kolorowanek

Aplikacja webowa, która zamienia głosowe pomysły dzieci w gotowe do wydruku kolorowanki. Wykorzystuje sztuczną inteligencję do rozpoznawania mowy, ulepszania promptów i generowania ilustracji, z możliwością automatycznego dołączania obrazów referencyjnych (np. członków rodziny).

Jak działa aplikacja

  1. Dziecko klika mikrofon i mówi, co chce pokolorować.
  2. AI zamienia mowę na tekst (i opcjonalnie “upiększa” prompt).
  3. Apka dorzuca do promptu zdjęcia referencyjne (np. członków rodziny z dedykowanego folderu).
  4. Wysyła request o kolorowankę, np. “Wiktor na Charizardzie”, “mama walcząca z Harrym Potterem”, “przypadkowy polityk kradnący coś z Ikea”.
  5. Obrazek leci prosto na drukarkę.

🎬 Demo

Desktop

Interfejs aplikacji na desktopie

Mobile

Interfejs aplikacji na urządzeniach mobilnych

✨ Funkcjonalność

Prompty głosowe

Dzieci mogą nagrać swoją prośbę przez mikrofon lub wybrać gotową sugestię. Aplikacja automatycznie transkrybuje mowę na tekst za pomocą OpenAI Whisper.

Sugestie

Dzieci mogą wybrać gotową sugestię. Są one losowane, aby za każdym razem czymś zaskoczyć.

Inteligentne ulepszanie promptów

AI (GPT) automatycznie rozszerza i wzbogaca prosty prompt dziecka, aby stworzyć bardziej szczegółową i ciekawą kolorowankę.

Obrazy referencyjne

Najciekawsza funkcja - aplikacja automatycznie wykrywa i dołącza zdjęcia referencyjne z dedykowanego folderu (np. zdjęcia członków rodziny, zwierząt domowych), dzięki czemu kolorowanka może przedstawiać “mamę walczącą z Harrym Potterem” czy “Wiktora na Charizardzie”.

Tryb poziomy i pionowy

Możliwość wyboru orientacji obrazu (proporcje 2:3 lub 3:2) w zależności od typu kolorowanki.

Automatyczne drukowanie

Opcja bezpośredniego wysłania wygenerowanej kolorowanki na drukarkę IPP, idealne dla szybkiego workflow z dziećmi.

Historia i przeglądanie

Wszystkie wygenerowane kolorowanki są zapisywane z metadanymi, co pozwala na późniejsze przeglądanie i ponowne drukowanie ulubionych projektów.

🖼️ Przykłady kolorowanek

Przykład 3

Przykład 1

Przykład 2

Przykład 4

Przykład 5

🧱 Architektura

Backend

Full-stack aplikacja oparta na TypeScript i Express, która integruje:

  • Gemini - generowanie czarno-białych ilustracji idealnych do kolorowania
  • OpenAI Whisper - transkrypcja nagrań głosowych na tekst
  • OpenAI GPT - ulepszanie promptów i inteligentne wykrywanie pasujących obrazów referencyjnych
  • IPP (Internet Printing Protocol) - bezpośrednie drukowanie na drukarkach sieciowych

Frontend

Interfejs użytkownika zbudowany w React z Vite i Material-UI, zapewniający responsywny design działający na desktopach i urządzeniach mobilnych.

Deployment

Aplikacja jest w pełni konteneryzowana z Docker Compose, co umożliwia łatwe uruchomienie obu serwisów jedną komendą.