Co to jest klasyfikacja tekstu?

Klasyfikacja tekstu to proces przypisywania tagów lub kategorii do tekstu zgodnie z jego treścią, z szerokim zastosowaniem, takim jak analiza tonacji, etykietowanie tematów, wykrywanie spamu i wykrywanie intencji.

GroupDocs.Classification Cloud API

Chmura GroupDocs.Classification

Nieustrukturyzowane dane w postaci nieprzetworzonego tekstu są wszędzie: e-maile, czaty, strony internetowe, media społecznościowe, zgłoszenia do pomocy technicznej, odpowiedzi na ankiety i nie tylko. Tekst może być niezwykle bogatym źródłem informacji, ale wydobywanie z niego wniosków może być trudne i czasochłonne ze względu na jego nieustrukturyzowany charakter. Firmy zwracają się do klasyfikacji tekstu w celu szybkiego i ekonomicznego uporządkowania tekstu w celu usprawnienia podejmowania decyzji i automatyzacji procesów.

Co to jest taksonomia?

Taksonomia to praktyka i nauka klasyfikacji. Słowo to jest również używane jako schemat taksonomiczny. Taksonomia to szczególna klasyfikacja. W szerszym, bardziej ogólnym sensie może odnosić się do klasyfikacji rzeczy lub pojęć, a także do zasad leżących u podstaw takiej klasyfikacji.

GroupDocs.Classification Cloud API

GroupDocs.Classification Cloud API pobiera nieprzetworzony tekst klasyfikacji dla taksonomii IAB-2 lub taksonomii dokumentów. Zwraca obiekt, który zawiera informacje o najlepszej klasie i jej prawdopodobieństwie oraz o prawdopodobieństwach pozostałych klas.

Przykład taksonomii IAB-2

GroupDocs.Classification Cloud API obsługuje schemat taksonomii IAB-2. Poniżej wymieniono niektóre przykłady taksonomii:

  • ‘Automobilowy’,
  • ‘Książki\i\Literatura’,
  • ‘Biznes\i\Finanse’,
  • „Kariera”,
  • ‘Edukacja’,
  • ‘Wydarzenia\i\Atrakcje’,
  • „Rodzina\i\Związki”,
  • ‘Sztuki piękne’,
  • ‘Jedzenie picie’,
  • ‘Zdrowe życie’,
  • ‘Zainteresowania’,
  • ‘Dom i ogród’,
  • ‘Zdrowie medyczne’,
  • ‘Kino’,
  • ‘Muzyka\i\Audio’,
  • ‘Aktualności\i\Polityka’,
  • ‘Finanse osobiste’
  • itp.

Żądanie cURL

### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-T C:/Temp/three-layouts.dwf

Odpowiedź

{
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
}

Przykład .NET

//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud (wymagana jest bezpłatna rejestracja).

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Document_from_Storage
    {
        public static void Run()
        {
            //DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud/ (wymagana jest bezpłatna rejestracja).
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest()
                {
                    Document = new FileInfo()
                    {
                        Name = "one-page.docx",
                        Folder = ""
                    },
                },
                bestClassesCount: "3");

                // Uzyskaj wyniki klasyfikacji
                ClassificationResponse response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

Przykład taksonomii dokumentów

Taksonomia dokumentów obejmuje następującą listę w GroupDocs.Classification Cloud API:

  • ADVE - reklamy, broszury.
  • E-mail
  • Formularz
  • List
  • Notatka — memorandum.
  • Aktualności - artykuły, w tym artykuły z aktualnościami.
  • Faktura
  • Raport
  • Wznawiać
  • Artykuły naukowe - naukowe.
  • Inne - inne klasy dokumentów lub spraw, co do których klasyfikator nie jest pewien.

Żądanie cURL

curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

Odpowiedź

{
  "bestClassName": "Other",
  "bestClassProbability": 36.8,
  "bestResults": [
    {
      "className": "Other",
      "classProbability": 36.8
    },
    {
      "className": "ADVE",
      "classProbability": 14.72
    },
    {
      "className": "News",
      "classProbability": 12.77
    }
  ],
  "code": 200,
  "status": "OK"
}

Przykład .NET

//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud (wymagana jest bezpłatna rejestracja).

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Raw_Text
    {
        public static void Run()
        {
            //DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud/ (wymagana jest bezpłatna rejestracja).
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");

                // Uzyskaj wyniki klasyfikacji
                var response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

Rozpocznij bezpłatny okres próbny już dziś

Rozpocznij bezpłatny okres próbny już dziś – wystarczy zarejestrować się w usłudze GroupDocs Cloud. Po zarejestrowaniu się możesz wypróbować zaawansowane funkcje przetwarzania plików oferowane przez GroupDocs Cloud.