W dzisiejszych czasach niezwykle istotną rolę odgrywają dane. Występują one nie tylko w formie cyfr, ale także i tekstu. Szczególnie ten drugi rodzaj danych trudniej jest przetworzyć. W takich przypadkach niezwykle pomocny bywa text mining. Czym on w rzeczywistości jest? Przede wszystkim jest uszczegółowieniem data mining. Text mining przy udziale właśnie data mining pozwala na analizę kolekcji tekstowych. Pierwsza definicja określa text mining jako wykorzystywanie wiedzy, która ukryta jest w dokumentach poprzez łączenie wolnego tekstu oraz zmiennych ilościowych, co w efekcie może prowadzić do uzyskania zupełnie nowych informacji. W tym przypadku text mining nie może być charakteryzowany jako przetwarzanie tekstu czy też tworzenie jego streszczeń. Inna definicja charakteryzuje text mining jako system, który służy wykrywaniu różnorodnych wzorców oraz zależności, które z nich wypływają. Warto nadmienić, iż text mining łączy w sobie kategoryzację tekstu, ekstrakcję informacji czy też uczenie maszynowe.