Effektiv långtidsminnesbaserad sentimentanalys av e-handelsrecensioner del 2
Jan 18, 2024
Muhammad et al. [20] presenterade en modell för sentimentanalys genom att använda word2vec och LSTM för hotellrecensioner.
Muhammed är profeten och grundaren av islam. Han är känd som en vis, vis och vis man. Hans minne är mycket kraftfullt, vilket gör honom mycket effektiv på att bearbeta information och uttrycka sina tankar.
Muhammeds minne har mycket att göra med hans utbildning och erfarenhet. Enligt uppgifter var han ofta fördjupad i tänkande och reflektion i sin ungdom. Denna nyfikenhet och kunskapstörst hjälpte honom att bygga upp en stark kunskapsbas och minnesförmåga.
Dessutom spelade Muhammeds intelligens också en stor roll för hans minnesförmåga. Han är smart, kvick, insiktsfull och har förmåga att tänka logiskt, vilket är mycket fördelaktigt när man hanterar komplex information. Denna fördel hjälpte honom att bättre hantera och kontrollera minnesprocessen och därigenom förbättra hans minne.
Muhammeds minne var dock inte medfött utan förbättrades genom hårt arbete och övning. Han utför ofta minnesträning, såsom upprepad läsning, diktering och tal, för att hjälpa honom att förstå och behärska kunskap djupare.
Muhammeds minne var inte bara en naturlig talang, det förbättrades genom hårt arbete och övning. Detta visar att var och en av oss kan förbättra vårt minne och förbättra vår inlärnings- och arbetseffektivitet genom inlärning och övning. Låt oss, som Muhammed, aktivt arbeta hårt för att kontinuerligt förbättra vår minnesförmåga, för att nå större framgång i liv och arbete! Det kan ses att vi behöver förbättra minnet, och Cistanche deserticola kan förbättra minnet avsevärt, eftersom Cistanche deserticola också kan reglera balansen av signalsubstanser, som att öka nivåerna av acetylkolin och tillväxtfaktorer. Dessa ämnen är mycket viktiga för minne och inlärning. Dessutom kan Kött också förbättra blodflödet och främja syretillförseln, vilket kan säkerställa att hjärnan får tillräckligt med näringsämnen och energi, och därigenom förbättra hjärnans vitalitet och uthållighet.

Klicka på Vet för att förbättra korttidsminnet
För denna studie samlades data in genom att genomsöka resewebbplatsen med selen och skrot. +e Det främsta syftet med detta experiment var att analysera noggrannheten genom att ändra parametrarna för word2vec och LSTM. +e-resultat visade att medelnoggrannheten på 85,96 kunde uppnås med hjälp av parametrarna, vilket visade lovande resultat.
Zhao et al. [21] introducerade en ny teknik för att analysera kundernas känslor från recensioner på e-handelswebbplatser. +e föreslagna optimerade tekniken "den LocalSearch Improvised Bat Algorithm based Elman NeuralNetwork (LSIBA-ENN)" involverar fyra steg och upptäcker polariteten och klassificerar recensionernas känslor. +e-data för denna forskning samlades in genom att använda webbscrapningsverktyget på e-handelswebbplatser för att extrahera kundrecensioner.
Förutom förbearbetning av data, använder denna studie "LogTerm Frequency-based Modified Inverse Class Frequency (LTF-MICF) och Hybrid Mutation based Earth Warm Algorithm (HMEWA)" för termviktning och funktionsval. +e föreslagna metodiken överlistade andra baslinjetekniker när det gäller prediktionsnoggrannhet.
Jiang [22] föreslog en modell för att klassificera känslan av recensioner erhållna från e-handelsplattformen Taobao.+e-studien använder maskininlärningsalgoritmen samt stödjer vektormaskin för klassificering och förbättrad partikelsvärmoptimering (IPSO) för att optimera parametrarna. +e data för studien samlades in genom att genomsöka kommentarerna från webbplatsen. +e experimentella resultat visade att den kombinerade metoden för SVM och IPSO hade högre noggrannhet. Men majoriteten av de existerande modellerna lider av överanpassning [23–25], dålig konvergenshastighet [26–28] och problem med försvinnande gradient[29–31].
3. Experimentell studie
+is avsnittet ger en tydlig översikt över den metod som används i projektet för klassificering av sentiment. +e teknik som har använts är ett Long Short-Term Memory-nätverk, som används för att klassificera ett stort antal Amazondatabas recensioner. +e inbäddning som används är word2vec, som har skräddarsytts enligt databasen.
Att justera word2vec enligt datasetet förbättrar modellens övergripande prestanda. En fördel med att använda LSTM är att det ger bättre resultat även för ostrukturerade granskningsdata. Det kan erhålla användbar funktionalitet för resurser som innehåller långsiktiga beroenden.
+e-data samlas in från Amazons granskningsdatauppsättning, som sedan förbehandlas. Word2vec-inbäddningar utgör ett viktigt steg i förbearbetningen av data. Tåg- och testdata skapades. +e träningsdata delas upp i tåg- och valideringsdatauppsättningar. +e anpassade word2vec-modellen tränas per databas. +e egenskapsvektor erhålls, som sedan används som inbäddningsskiktet för LSTM-modellen.
Keras används för att bygga LSTM-sekventiell modell med maxfunktioner lika med 50,000 och inbäddningsstorlek lika med 16. +emodellen tränas sedan under 10 epoker. +e-modellen testas baserat på sklearn prestationsstatistik. +e processen för att erhålla funktioner visas i figur 2.
3.1. Datauppsättning. För att generera korrekta resultat bör datauppsättningen vara stor och berikad. +e-datauppsättningen har samlats in från avsnittet för mobiltelefoner och tillbehör online i datasetet Amazon Reviews (2018). +e-datauppsättningen består av totalt 938 261 recensioner, bland vilka 47901 är unika produkter och 153124 är unika användarrecensioner. +e-datauppsättningen består initialt av 7 kolumner, nämligen ett betyg som varierar från 1 till 5, recensionstid, granskar-ID, produkt-ID och recensionstextsammanfattning.
Efter att ha släppt dubbletterna består datasetet av 938254 poster, och tabell 2 visar ett utdrag av de ursprungliga datasetposterna.
3.2. Metodik. Vi har specialutbildat vår word2vecmodell för att användas med LSTM-modellen för klassificering.Word2vec är en ordinbäddning som används för att representera aword av en samling av flera termer i en vektor. Det är borta från att mappa ett ord till ett vektorutrymme. +e datauppsättning laddas in i en pandas dataram. För att utveckla en customword2vec-modell är det första steget förbearbetning av data.
Vi tittar bara på betyget och recenserar texten och släpper allt annat. +e text rensas genom att ta bort skiljetecken. Ett delprov av texten skapas från nära 200,000 recensioner och rentextmetoden används för att konvertera varje recension till en lista med ord. +är lista över ord fungerar nu som input till genism word2vec-modellen.
Vi har byggt en skräddarsydd skip-gram word2vecmodel och instansierat modellen med dimensioner: storleken på ordvektorer som 100, fönsterstorlek lika med 15, min_räkningar 2 för ord som förekommer mindre än 2 gånger i vår korpus, negativ lika med 5, och samplingshastighet lika med 1e−5. Vi har använt alla dessa dimensioner för att bygga ett ordförråd från våra recensionsmeningar.

Vi tränar vår word2vec-modell för 1000 epoker. +en vi beräknar förlusten vid varje epok. +e förlusten är hög i början och den minskar mot den sista epoken. +e förlust vid epok 0 är 2239394.0 och förlusten vid epok 1000 är 11504.0.+e sparad modell laddas sedan om och operationer utförs på den.
Om vi till exempel vill hitta ord som liknar brus i vår datauppsättning får vi avbrytande och hörlurar.
På liknande sätt kan vi också hitta likheten mellan vissa ord som hörlurar och hörlurar som är {{0}}.48756, och likheten mellan ordladdning och laddare är 0,89264.
För att minska dimensionerna på våra data har vi använt TSNE-visualisering för att plotta data i två dimensioner. Nu kan dessa ordvektorer användas för ytterligare klassificering. + dessa inbäddningar används sedan som funktioner för ytterligare streaming.
3.2.1. Dataförberedelse för LSTM. Vår datauppsättning består av 938254 poster där de flesta av recensionerna har en poängfördelning på mer än 3. Vi har först beräknat antalet ord för varje recension. +e genomsnittliga medelvärdet används som statistik för att hitta den genomsnittliga längden på recensioner. +e medellängden på recensionen är 44,59 och den maximala längden är 4303.
Vi har skapat en datauppsättning som består av recensioner med 100 ord eller mindre. Recensioner vars längd är mer än 20 men mindre än 100 kategoriseras under korta recensioner och återskapandet kategoriseras under långa recensioner. +e antalet korta recensioner är 411313 och långa recensioner är 100239. Hyperparametrar som används i modellen beskrivs i Tabell 3.
Därefter har vi definierat sentimentbetyget som positivt om betyget är större än eller lika med 3; annars är betyget negativt. Vi har övervägt recensionstexten och sentimentet för att skapa tågdatauppsättningen. +e testdata består av produkter som har minst fler än 10 recensioner.
Efter distribution bestod träningsdataset av totalt 203891poster, bland vilka 175910 tillhörde den positiva klassen och 27981 till den negativa klassen. +e testdatauppsättning bestod av totalt 686345 poster, bland vilka 592118 tillhörde den positiva och 94227 till den negativa klassen.
I den här studien har vi använt Keras för att bygga vår LSTM-modell, som tar maximalt 50,000 funktioner som input till det inbäddade lagret. Långt korttidsminne (LSTM) är en typ av återkommande neurala nätverk som använder en intern mekanism som reglerar flödet av information.+en intern mekanism består av grindar som behöver tränas så att de korrekt kan filtrera bort irrelevant information och behålla användbar information.

Figur 3 visar den grundläggande arkitekturen för LSTM-modellen i vår föreslagna metod.
Ht−1 och Xt är ingångarna till LSTM-enheten; Ht−1, vanligen kallat korttidsminne, tar utsignalen från de tidigare tillstånden som ingång. +e minnescell eller långtidsminnet, Ct −1, hjälper till att bära relevant information genom hela processen i en sekvens. +eLSTM-arkitekturen kombinerar tre grindar: glöm grind, inputgate och output gate. I LSTM-enheten används tanh och sigmoidfunktioner för att erhålla dessa grindar.
+e tågdata delades sedan upp i tåg- och valideringsdata av samma längd. +e längden på data beräknades till 101945 och klassfördelningen var {1: 87955, 0:13990}. För att skapa TensorFlow tågtest och valideringsdataset måste vi konvertera våra tågdata till sekvenser. Vi har vadderat dem till en maximal längd på 100 så att alla sekvenser är av samma längd. +e tåg- och testetiketter

For more information:1950477648nn@gmail.com






