VectifyAI ogłosiło właśnie premierę Mafin 2.5 oraz open-source’owego frameworku PageIndex, które razem tworzą nowe podejście do wyszukiwania informacji w dokumentach finansowych. Wynik 98,7% dokładności na benchmarku FinanceBench robi wrażenie – szczególnie zestawiony z wynikami GPT-4o na poziomie około 31%.
Jeśli kiedykolwiek próbowaliście zbudować system RAG do analizy raportów rocznych, wiecie, z czym jest problem. Standardowe podejście – pociąć tekst na kawałki, wrzucić do bazy wektorowej, liczyć na podobieństwo semantyczne – kompletnie rozsypuje się przy dokumentach finansowych. Tabele tracą kontekst, nagłówki znikają, liczba w komórce bez wiersza i kolumny nic nie znaczy. Branżowo mówi się o „text soup” – zupie z tekstu, z której nawet najlepszy model nie wyciągnie sensownych wniosków.
Dlaczego wektory nie wystarczają przy 10-K i 10-Q
Tradycyjny RAG opiera się na podobieństwie semantycznym. Pytasz o „zysk netto”, system szuka fragmentów tekstu, które brzmią jak „zysk netto”. Problem polega na tym, że dokumenty finansowe są hierarchiczne i layout-dependent. Konwersja PDF-u do tekstu zazwyczaj niszczy tę strukturę, zanim LLM w ogóle dostanie szansę na analizę. Garbage in, garbage out – żaden model nie naprawi strukturalnie uszkodzonych danych wejściowych.
VectifyAI proponuje zerwanie z tym paradygmatem. PageIndex zamiast płaskich embeddingów buduje hierarchiczne drzewo dokumentu – inteligentną mapę, po której model może nawigować jak analityk przeskakujący między sekcjami sprawozdania.
Co konkretnie robi PageIndex inaczej
Framework wprowadza kilka kluczowych koncepcji:
- Drzewiaste indeksowanie – zamiast losowych fragmentów tekstu, dokument staje się nawigowaną strukturą z zachowanymi relacjami między nagłówkami, tabelami i przypisami
- Vision-native RAG – model może dosłownie „zobaczyć” układ strony, co jest kluczowe przy skomplikowanych siatach danych i wykresach, gdzie sama treść OCR nie wystarcza
- Pełna ścieżka audytowa – każda odpowiedź jest powiązana z konkretnym węzłem, stroną i sekcją w oryginalnym dokumencie, co w środowiskach regulowanych ma kapitalne znaczenie
- Bezpośredni dostęp do SEC – Mafin 2.5 indeksuje formularze 10-K, 10-Q i 8-K wprost ze źródła, bez pośredników
„To interesujące podejście i wyniki brzmią imponująco, ale warto zachować pewien sceptycyzm. Branżowe benchmarki jak FinanceBench to jedno – wdrożenia produkcyjne to zupełnie inna historia. Z jednej strony pełna ścieżka audytowa i eliminacja 'czarnej skrzynki’ wektorowego wyszukiwania to dokładnie to, czego potrzebują instytucje finansowe działające w regulowanym środowisku. Z drugiej – pytanie, jak system radzi sobie z dokumentami spoza angloamerykańskiego systemu raportowania, ze specyfiką europejskich regulacji MIFID czy lokalnych wymogów sprawozdawczych. Czy 98,7% utrzymuje się poza kontrolowanymi warunkami benchmarku? I kto odpowiada, gdy system pomyli się przy audycie wartym miliony? To pytania, które każdy wdrożeniowiec powinien zadać przed podpisaniem kontraktu.”
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Mafin 2.5 jako silnik wnioskowania
Mafin 2.5 to nie tylko fine-tuned model finansowy – VectifyAI pozycjonuje go jako pełny reasoning engine zintegrowany z danymi rynkowymi w czasie rzeczywistym. Agent pobiera transkrypty rozmów z analitykami (earnings calls), śledzi notowania z Russell 3000 i Nasdaq, a dostęp do archiwum SEC ma wbudowany natywnie.
Porównanie do Perplexity (ok. 45% na FinanceBench) jest tu szczególnie mówiące. Perplexity to przecież system zaprojektowany z myślą o wyszukiwaniu – a mimo to wypada blado na tle specjalizowanego rozwiązania finansowego.
Open-source i dostępność
PageIndex jest dostępny na GitHubie jako projekt open-source: github.com/VectifyAI/PageIndex. To ważny sygnał – VectifyAI stawia na przejrzystość techniczną i pozwala społeczności zweryfikować podejście, zamiast chować je za marketingową kurtyną. Szczegóły techniczne dotyczące Mafin 2.5 opublikowano na blogu projektu pod adresem pageindex.ai/blog/Mafin2.5.
Sektor fintech i analityki finansowej obserwuje od jakiegoś czasu problem halucynacji w kontekście dokumentów strukturalnych. Jeśli „Vectorless RAG” okaże się odpowiedzią, VectifyAI może trafić w bardzo realną lukę rynkową – szczególnie w segmencie compliance i audytu, gdzie każda błędna odpowiedź kosztuje.
