Co je klasifikace textu?

Klasifikace textu je proces přiřazování značek nebo kategorií k textu podle jeho obsahu s širokými aplikacemi, jako je analýza sentimentu, označování témat, detekce spamu a detekce záměrů.

GroupDocs.Classification Cloud API

GroupDocs.Classification Cloud

Nestrukturovaná data ve formě nezpracovaného textu jsou všude: e-maily, chaty, webové stránky, sociální média, lístky na podporu, odpovědi na průzkumy a další. Text může být extrémně bohatým zdrojem informací, ale získávání poznatků z něj může být obtížné a časově náročné kvůli jeho nestrukturované povaze. Firmy se obracejí na klasifikaci textu, aby strukturovaly text rychlým a nákladově efektivním způsobem, aby zlepšily rozhodování a automatizovaly procesy.

Co je taxonomie?

Taxonomie je praxe a věda o klasifikaci. Slovo se také používá jako taxonomické schéma. Taxonomie je zvláštní klasifikace. V širším, obecnějším smyslu může odkazovat na klasifikaci věcí nebo pojmů, jakož i na principy, na nichž je taková klasifikace založena.

GroupDocs.Classification Cloud API

GroupDocs.Classification Cloud API načítá nezpracovaný výstup klasifikace textu pro taxonomii IAB-2 nebo taxonomii dokumentů. Vrací objekt, který obsahuje informace o nejlepší třídě a její pravděpodobnosti ao pravděpodobností ostatních tříd.

Příklad taxonomie IAB-2

GroupDocs.Classification Cloud API podporuje schéma taxonomie IAB-2. Některé příklady taxonomie jsou uvedeny níže:

  • ‘Automobilový’,
  • ‘Knihy\and\Literatura’,
  • ‘Obchod\and\Finance’,
  • ‘Kariéra’,
  • ‘Vzdělání’,
  • ‘Události\and\Atrakce’,
  • ‘Rodina\and\vztahy’,
  • ‘Výtvarné umění’,
  • ‘Jídlo pití’,
  • ‘Zdravý život’,
  • ‘Koníčky zájmy’,
  • ‘Dům a zahrada’,
  • ‘Lékařství\Zdraví’,
  • ‘Filmy’,
  • ‘Music\and\Audio’,
  • ‘Zprávy\and\Politika’,
  • ‘Osobní\Finance’
  • atd.

cURL požadavek

### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-T C:/Temp/three-layouts.dwf

Odezva

{
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
}

Příklad .NET

//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud (je nutná bezplatná registrace).

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Document_from_Storage
    {
        public static void Run()
        {
            //TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud/ (je nutná bezplatná registrace).
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest()
                {
                    Document = new FileInfo()
                    {
                        Name = "one-page.docx",
                        Folder = ""
                    },
                },
                bestClassesCount: "3");

                // Získejte výsledky klasifikace
                ClassificationResponse response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

Příklad taxonomie dokumentů

Taxonomie dokumentů zahrnuje následující seznam v GroupDocs.Classification Cloud API:

  • ADVE - inzeráty, brožury.
  • E-mailem
  • Formulář
  • Dopis
  • Memo - memorandum.
  • Novinky - články, včetně novinových článků.
  • Faktura
  • Zpráva
  • Životopis
  • Vědecko - vědecké práce.
  • Jiné – ostatní třídy dokumentů nebo případy, kdy si klasifikátor není jistý.

cURL požadavek

curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

Odezva

{
  "bestClassName": "Other",
  "bestClassProbability": 36.8,
  "bestResults": [
    {
      "className": "Other",
      "classProbability": 36.8
    },
    {
      "className": "ADVE",
      "classProbability": 14.72
    },
    {
      "className": "News",
      "classProbability": 12.77
    }
  ],
  "code": 200,
  "status": "OK"
}

Příklad .NET

//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud (je nutná bezplatná registrace).

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Raw_Text
    {
        public static void Run()
        {
            //TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud/ (je nutná bezplatná registrace).
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");

                // Získejte výsledky klasifikace
                var response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

Začněte bezplatnou zkušební verzi ještě dnes

Začněte bezplatnou zkušební verzi ještě dnes – vše, co potřebujete, je zaregistrovat se do cloudové služby GroupDocs. Jakmile se zaregistrujete, jste připraveni vyzkoušet výkonné funkce zpracování souborů, které nabízí GroupDocs Cloud.