Analiza_danych_i_wizualizacja
Projekt Python do automatycznej analizy danych, trenowania prostych modeli ML (regresja / klasyfikacja), wykrywania anomalii oraz wizualizacji wyników w spójnym, estetycznym stylu.
📁 Struktura repozytorium
analiza_danych_i_wizualizacja/
│
├── analysis.py # logika analizy danych i modeli ML
├── viz.py # spójne wizualizacje w stylu #555555
├── main # skrypt uruchamiający (np. CLI / notebook)
├── demo_agent_chat # przykładowe użycie agentów LLM
├── LLM_agents_vs # porównanie wyników agentów LLM
├── requirements.txt # zależności
└── README.md # dokumentacja projektu
Utwórz i aktywuj środowisko wirtualne:
python -m venv venv
source venv/bin/activate # Linux / macOS
venv\Scripts\activate # Windows
Zainstaluj wymagane biblioteki:
pip install -r requirements.txt
Zawartość pliku requirements.txt:
pandas
scikit-learn
matplotlib
scipy
google-adk
google-genai
python-dotenv
Użycie
1. Analiza danych
Moduł analysis.py umożliwia:
-
automatyczne czyszczenie i konwersję danych,
-
regresję liniową i sieć neuronową (MLP),
-
klasyfikację,
-
wykrywanie anomalii (IsolationForest + Z-score).
2. Wizualizacje
Moduł viz.py generuje wykresy w spójnym stylu (#555555, jasny tekst, turkusowo–zielona paleta).
Obsługiwane typy wykresów:
- histogram
- boxplot
- scatter
- reg_line
- confusion_matrix
- pred_vs_true
- pred_sequence
- residuals
- anomaly_scatter
3. Agenci LLM
Repozytorium zawiera pliki:
Pokazują one integrację analizy danych z agentami LLM (np. Google GenAI) — w celu wspomagania interpretacji wyników i automatyzacji procesów analitycznych.
Kluczowy wniosek projektu:
Instrukcja (prompt) jest najważniejszym elementem pracy agenta LLM.
Od sposobu, w jaki formułujesz kontekst, polecenia i ograniczenia, zależy jakość, precyzja i użyteczność odpowiedzi.
Nawet przy tym samym modelu (np. Google GenAI lub OpenAI GPT) różnice między wynikami mogą być ogromne — wyłącznie z powodu innej instrukcji.
W projektach analitycznych dobrze zdefiniowany kontekst i rola agenta (np. “ekspert ds. wizualizacji danych” lub “model interpretujący wyniki regresji”) mają kluczowe znaczenie dla skuteczności całego systemu.
Author
Marzena Halama