Methodologie

Wie KI-Radar Tools bewertet

Der Radar-Score ist keine Herstellerwertung und keine Kaufempfehlung. Er ist eine redaktionelle Ersteinschätzung für deutsche Unternehmen, Kanzleien und Fachbereiche, die ein Tool in eine Shortlist aufnehmen oder ausschließen müssen.

KI-Radar-Methodik mit Quellen- und Preisprüfung

Radar-Score

Sechs Kriterien statt Modell-Hype

Ein KI-Tool kann im Demo stark wirken und im Alltag trotzdem scheitern. Deshalb bewertet KI-Radar nicht nur Modellqualität, sondern auch Datenrisiko, Betriebsfähigkeit, Rechte, Integrationen, Kostenlogik und Nachvollziehbarkeit.

Die Gewichtung ist bewusst auf Unternehmensbeschaffung ausgelegt: Ein Tool mit starkem Modell, aber schwachen Admin-Kontrollen, unklarer Datenverarbeitung oder fehlenden Integrationen wird nicht automatisch besser bewertet als ein fachlich engeres, aber betrieblich belastbares System.

25 %

Quellenqualität und Fachabdeckung

Bewertet wird, ob ein Tool belastbare Quellen, Fachinhalte, lange Dokumente, Zitierfähigkeit und überprüfbare Antworten unterstützt. Ein schneller Demo-Chat reicht nicht aus.

20 %

DSGVO, Sicherheit und AI-Act-Risiko

Wichtig sind Datenverarbeitung, Training, Löschung, AVV/DPA, Datenresidenz, Auditierbarkeit, Rollenrechte und Risiko im EU-Kontext.

20 %

Integrationen und Betriebsfähigkeit

Ein Tool gewinnt, wenn es in Microsoft 365, Google Workspace, DMS, CRM, Helpdesk, DATEV, GRC oder interne Wissensquellen passt.

15 %

Admin-, Rollen- und Governance-Funktionen

SSO, SCIM, Rollenrechte, Protokollierung, Richtlinien, Export, Freigabeprozesse und zentrale Verwaltung sind wichtiger als einzelne Modell-Benchmarks.

10 %

Preis-Leistungs-Verhältnis

Preisindikatoren werden mit Einsatzbreite, Vertragsmodell, Nutzerzahl, Verbrauchslogik, Einführungsaufwand und erwartetem Nutzen abgeglichen.

10 %

Support und Dokumentation

Pluspunkte gibt es für klare Dokumentation, DACH-nahe Unterstützung, transparente Roadmaps, Statusseiten, Sicherheitsnachweise und verlässliche Anbieterkommunikation.

Quellenpolitik

Welche Quellen wir nutzen

KI-Radar trennt zwischen belegbaren Produktinformationen und redaktioneller Bewertung. Preise, Sicherheitsfunktionen, Integrationen, API-Umfang, Datenverarbeitung und Vertragslogik werden so weit wie möglich aus Primärquellen abgeleitet. Wo Anbieter nur „auf Anfrage” kommunizieren, steht bewusst ein Preisindikator statt einer Scheingenauigkeit.

Primärquellen zuerst

Preise, Sicherheitsfunktionen und Integrationen werden bevorzugt aus Anbieter-Dokumentation, offiziellen Produktseiten, Trust Centern und API-Dokumentation abgeleitet.

Sekundärquellen nur zur Einordnung

Analystenberichte, Presseberichte, Kundenbeispiele und Marktbeobachtung helfen bei Priorisierung und Kontext, ersetzen aber keine prüfbaren Produkt- oder Vertragsunterlagen.

Keine ungeprüften Herstellerclaims

Begriffe wie DSGVO-konform, Enterprise-ready oder sicher werden nicht als Tatsache übernommen. KI-Radar übersetzt sie in konkrete Prüffragen.

Zeitstand offenlegen

Preisindikatoren und Produktstände sind Momentaufnahmen. Deshalb wird der letzte Prüfstand genannt und bei sichtbaren Änderungen vorgezogen aktualisiert.

Recherche-Prozess

Vom Anbieterclaim zur redaktionellen Einordnung

Die Tool-Profile folgen einem festen Ablauf, damit breite Assistenten, Fachtools und Governance-Plattformen vergleichbar bleiben, ohne ihre Unterschiede zu glätten.

1. Quellen sammeln

Ausgangspunkt sind Herstellerseiten, Preis- und Produktdokumentation, Trust Center, Security-Dokumente, API-Dokumentation, Support-Seiten und relevante Behörden- oder Normquellen.

2. Einsatzfeld abgrenzen

Jedes Tool wird einem primären Einsatzfeld zugeordnet. Dabei zählt nicht Marketing-Sprache des Anbieters, sondern der realistische Unternehmensprozess: Assistenz, Kundenservice, Legal, Tax, HR, Search, Agenten oder Governance.

3. Unternehmensrisiko prüfen

Die Redaktion prüft, welche Daten typischerweise verarbeitet werden, ob personenbezogene oder vertrauliche Informationen betroffen sind und welche Kontrollpunkte vor einem Pilot nötig sind.

4. Beschaffungssicht ergänzen

Preislogik, Vertriebsweg, Mindestpakete, Enterprise-Anforderungen, SSO, Löschung, Export, Support und Integrationen werden so formuliert, dass Einkauf und IT sie in einer Shortlist verwenden können.

5. Redaktionell verdichten

Aus den Quellen entsteht keine Herstellerbeschreibung, sondern eine Einordnung mit Stärken, Grenzen, Hauptrisiko, Pilot-Fokus und Alternativen.

6. Review und Update

Neue Preise, Produktänderungen, regulatorische Entwicklungen und sichtbare Anbieter-Updates führen zu einer Neubewertung. Tool-Seiten werden mindestens quartalsweise priorisiert überprüft.

Fact-Checking

Wie wir Aussagen prüfen

Jede Tool-Seite unterscheidet zwischen Faktenfeld und redaktioneller Bewertung. Fakten sind zum Beispiel Preisindikator, Anbieter, Vertriebsweg, Integrationen oder Sicherheitsfunktionen. Bewertung sind dagegen beste Passung, Hauptrisiko, Shortlist-Relevanz und Pilot-Fokus.

Vor Veröffentlichung werden die zentralen Aussagen gegen die vorhandenen Quellen geprüft. Bei unklaren oder widersprüchlichen Informationen wird konservativ formuliert: „auf Anfrage”, „planabhängig”, „prüfen” oder „vor Vertrag bestätigen” ist ehrlicher als eine scheinbar präzise Aussage ohne belastbare Quelle.

Fehler können trotzdem passieren, weil Anbieter Preise, Pakete, Modellnamen und Vertragsbedingungen regelmäßig ändern. Hinweise auf Fehler oder veraltete Angaben können über die Kontaktseite gemeldet werden. Korrekturen werden redaktionell geprüft und bei relevanten Änderungen im nächsten Update der Seite berücksichtigt.

Score-Bänder

Wie die Zahlen gelesen werden sollten

Ein Radar-Score ist kein absolutes Qualitätsurteil. Er zeigt, wie gut ein Tool für den jeweiligen Unternehmenskontext in die Shortlist passt. Werte um 8,4 stehen typischerweise für sehr relevante Enterprise- oder Fachlösungen mit breiter Einsetzbarkeit, klarer Marktrolle oder besonders starkem Fit in einer Kategorie.

Werte um 8,1 bedeuten nicht, dass ein Tool schwach ist. Häufig handelt es sich um Spezialisten, jüngere Anbieter, nischigere Einsatzfelder oder Lösungen, die vor dem Rollout mehr Prüfung bei Daten, Integration, Preis oder Governance benötigen. Deshalb ist der Vergleich innerhalb einer Kategorie wichtiger als der Vergleich völlig verschiedener Tool-Typen.

Ein Legal-AI-Tool, ein HR-System und ein Kundenservice-Chatbot lösen unterschiedliche Probleme. KI-Radar versucht deshalb nicht, einen universellen Sieger zu bestimmen, sondern die richtige Beschaffungsfrage sichtbar zu machen: Wo entsteht Nutzen, welche Daten sind betroffen, welche Kontrollen fehlen und welcher Pilot wäre belastbar?

Dadurch bleibt die Bewertung wiederholbar: Neue Tools werden nicht nach Bauchgefühl einsortiert, sondern gegen dieselben Beschaffungs-, Datenschutz- und Governance-Fragen geprüft.

Datenstand

Wie Aktualisierungen priorisiert werden

KI-Produkte ändern sich schnell: Preise werden umgestellt, Modellnamen wechseln, Enterprise-Funktionen werden nachgereicht und Integrationen verschwinden oder entstehen neu. KI-Radar priorisiert Updates deshalb nach Sichtbarkeit und Risiko. Hohe Priorität haben Preisänderungen, neue Datenschutzunterlagen, geänderte Enterprise-Pläne, Sicherheitsvorfälle, relevante AI-Act-Änderungen und Tools mit hohem Such- oder Entscheidungsinteresse.

Wenn ein Anbieter Rückmeldung gibt, wird sie nicht automatisch übernommen. Die Redaktion prüft, ob der Hinweis durch öffentliche Unterlagen, nachvollziehbare Dokumentation oder konkrete Produktinformationen belegbar ist. Reine Marketingkorrekturen, unbelegte Superlative oder Wünsche nach besserer Platzierung verändern den Score nicht.

Bei echten Fehlern wird die betroffene Seite korrigiert. Bei strittigen Einschätzungen kann die Formulierung präzisiert werden, etwa durch genauere Abgrenzung von Zielgruppe, Land, Rechtsraum, Preismodell oder Pilotvoraussetzung. Ziel ist nicht, Anbieter abzuwerten, sondern Beschaffungsentscheidungen belastbarer zu machen.

Unabhängigkeit

Keine bezahlten Scores, keine Hersteller-Rankings

KI-Radar verkauft keine besseren Platzierungen, keine Score-Erhöhungen und keine garantierten Empfehlungen. Anbieterlinks können gekennzeichnet weiterleiten; die redaktionelle Einordnung folgt trotzdem denselben Prüfpunkten.

Ein Tool kann kommerziell interessant sein und trotzdem kritisch bewertet werden. Umgekehrt kann ein Tool ohne Partnerbeziehung eine starke Einordnung erhalten, wenn Einsatzfeld, Kontrollen, Preislogik und Unternehmensnutzen überzeugen.

Affiliate-Offenlegung ansehen

KI-Nutzung in der Redaktion

KI hilft beim Strukturieren, nicht beim Freigeben

KI-Werkzeuge können in der Redaktion für Strukturierung, Tabellenentwürfe, Textvarianten oder Zusammenfassungen eingesetzt werden. Sie ersetzen aber keine menschliche Prüfung von Quellen, Preisangaben, Risiken, rechtlichen Hinweisen oder redaktioneller Bewertung.

Keine Tool-Seite soll so wirken, als sei ein Produkt praktisch getestet worden, wenn nur öffentliche Quellen ausgewertet wurden. Wo KI-Radar von Pilot, Shortlist oder Beschaffungsfrage spricht, ist damit eine redaktionelle Ersteinschätzung gemeint, kein zertifizierter Testbericht.

Entwürfe aus KI-Systemen werden vor Veröffentlichung auf Tonalität, Faktentreue, Redundanz und mögliche Übertreibungen geprüft. Besonders sensible Aussagen zu Recht, Steuern, Datenschutz, Sicherheit und Preisen werden nicht allein aus Modellantworten übernommen.

Grenzen

Was der Score nicht ersetzt

Der Score ersetzt keine Rechts-, Steuer-, Datenschutz- oder IT-Sicherheitsberatung. Er ersetzt auch keinen eigenen Pilot. Er soll helfen, die richtigen Fragen schneller zu stellen, Risiken früher zu erkennen und ungeeignete Tools früher auszusortieren.

Redaktionsprinzipien ansehen