Descriere

Convolutional neural networks (CNN) sunt un tip de rețele neuronale artificiale utilizate în principal pentru problemele legate de interpretarea datelor vizuale (imagini și videoclipuri), localizarea obiectelor, segmentarea semantică, recunoașterea optică a caracterelor etc. Un CNN poate fi construit cu mai multe straturi. Se cunosc trei mari categorii de straturi: de convoluție, de pooling și complet conectate, asociate cu o funcție comună de activare.

Stratul de convoluție este blocul central al CNN-ului și reprezintă partea principală a sarcinii computaționale a rețelei. Parametrii stratului convoluțional constau într-un set de filtre aplicate. Fiecare filtru este de mici dimensiuni (de-a lungul lățimii și înălțimii), dar se extinde prin toată adâncimea volumului de intrare.

Stratul de pooling se introduce periodic între straturile consecutive convoluționale într-o arhitectură CNN. Funcția sa este de a reduce progresiv dimensiunea spațială, pentru a reduce cantitatea de parametri și de calcul în rețea și, prin urmare, de a evita supraantrenarea. Stratul „Pooling” funcționează independent la fiecare strat din adâncimea intrării și o redimensionează spațial, utilizând operația MAX.

Stratul complet conectat are neuronii cu conexiuni complete la toate activările din stratul anterior, așa cum se observă în rețelele neuronale obișnuite, Artificial Neural Networks (ANN). Activarea lor poate fi astfel calculată cu o multiplicare a matricei adăugându-se și deplasarea (termenul prag), cunoscut drept bias.

Clasificarea poate fi făcută de un strat Softmax. Practic, fiecare neuron dintr-un strat este conectat la fiecare neuron din stratul următor, iar fiecare strat își primește aportul din ieșirea stratului anterior.

Mai jos sunt date câteva exemple de aplicații ale CNN.

I. În sectorul sănătății, aplicațiile de imagistică medicală implică clasificarea, detectarea și segmentarea obiectelor. Visual Geometry Group (VGGNet) este o rețea dezvoltată de Karen Simonyan și Andrew Zisserman (Simonyan and Zisserman, 2015). Rezultatele lor arată că adâncimea rețelei are o influență semnificativă asupra performanței rețelei. Modelul lor conține 16 straturi convoluționale complet conectate și o arhitectură omogenă care realizează convoluții de tip 3x3 și pooling 2x2.

II. În sectorul economic, unde se încadrează și lucrarea amintită, a fost utilizat word2vec ca încorporare de cuvinte pentru a forma stratul de intrare al CNN-ului. Word2vec este utilizat pentru a construi matricea vectorială ce caracterizează d.p.d.v. semantic fiecare cuvânt din intrare. În timp ce se află în stratul de mapare, mai multe hărți cu caracteristici alcătuiesc unul dintre straturile de calcul; o hartă caracteristică corespunde unui plan și toate ponderile neuronilor de pe același plan sunt egale. Designul CNN l-a făcut un clasificator adecvat pentru extragerea caracteristicilor semantice din textele corporale. Descrierea detaliată a structurii convoluționale a modelului de rețea neuronală se află în lucrarea atașată (Li et al., 2020).

III. În sectorul comunicării virtuale, unde se încadrează lucrarea (Iftene et al., 2020), modelul CNN este utilizat pentru analiza în timp real a canalului Twitter, dovedindu-se că el poate să ofere elemente cheie despre credibilitatea tweet-urilor cât și a utilizatorilor care le-au postat. “Hărțile” utilizate aici integrează informații culese de la utilizatori. Se crează astfel “imagini” în care se pot apoi localiza “zonele”, adică postările și autorii lor, din care provin știrile categorizate în false și non-false.

Referințe

(Simonyan and Zisserman, 2015) Simonyan, Karen and Zisserman, Andrew (2015). Very Deep Convolutional Networks for Large-Scale Image Recognition. In: International Conference on Learning Representations - arXiv:1409.1556.
(Li et al., 2020) Youzhu Li, Huiling Zhou, Zhonglong Lin, Yifan Wang, Shunjie Chen, Chang Liu, Zhouyang Wang, Daniela Gifu, Jingbo Xia. Investigation in the influences of public opinion indicators on vegetable prices by corpora construction and WeChat article analysis. In: Future Generation Computer Systems, vol. 102, pages 876-888, 2020, https://www.sciencedirect.com/science/article/pii/S0167739X18327341
(Iftene et al., 2020) Adrian Iftene, Daniela Gîfu, Andrei-Remus Miron, Mihai-Ștefan Dudu. A Real-Time System for Credibility on Twitter. In: Proceedings of the 12th Language Resources and Evaluation Conference, pages 6166–6173, Marseille, France. European Language Resources Association, https://aclanthology.org/2020.lrec-1.757.pdf

Convolutional neural networks (CNN)