Convolutional neural networks (CNN)

Convolutional Neural Networks

Visual Geometry Group

Word2Vec

Data încărcării
June 2, 2022
Autor
Laura Pistol
Descriere

Convolutional neural networks (CNN) sunt un tip de rețele neuronale artificiale  utilizate în principal pentru problemele legate de interpretarea datelor vizuale (imagini  și videoclipuri), localizarea obiectelor, segmentarea semantică, recunoașterea optică a  caracterelor etc. Un CNN poate fi construit cu mai multe straturi. Se cunosc trei mari  categorii de straturi: de convoluție, de pooling și complet conectate, asociate cu o  funcție comună de activare.  

Stratul de convoluție este blocul central al CNN-ului și reprezintă partea principală  a sarcinii computaționale a rețelei. Parametrii stratului convoluțional constau într-un set  de filtre aplicate. Fiecare filtru este de mici dimensiuni (de-a lungul lățimii și înălțimii),  dar se extinde prin toată adâncimea volumului de intrare.  

Stratul de pooling se introduce periodic între straturile consecutive convoluționale  într-o arhitectură CNN. Funcția sa este de a reduce progresiv dimensiunea spațială,  pentru a reduce cantitatea de parametri și de calcul în rețea și, prin urmare, de a evita  supraantrenarea. Stratul „Pooling” funcționează independent la fiecare strat din  adâncimea intrării și o redimensionează spațial, utilizând operația MAX. 

Stratul complet conectat are neuronii cu conexiuni complete la toate activările din  stratul anterior, așa cum se observă în rețelele neuronale obișnuite, Artificial Neural  Networks (ANN). Activarea lor poate fi astfel calculată cu o multiplicare a matricei  adăugându-se și deplasarea (termenul prag), cunoscut drept bias.  

Clasificarea poate fi făcută de un strat Softmax. Practic, fiecare neuron dintr-un  strat este conectat la fiecare neuron din stratul următor, iar fiecare strat își primește  aportul din ieșirea stratului anterior. 

Mai jos sunt date câteva exemple de aplicații ale CNN.  

I. În sectorul sănătății, aplicațiile de imagistică medicală implică clasificarea,  detectarea și segmentarea obiectelor. Visual Geometry Group (VGGNet) este o  rețea dezvoltată de Karen Simonyan și Andrew Zisserman (Simonyan and  Zisserman, 2015). Rezultatele lor arată că adâncimea rețelei are o influență  semnificativă asupra performanței rețelei. Modelul lor conține 16 straturi  convoluționale complet conectate și o arhitectură omogenă care realizează  convoluții de tip 3x3 și pooling 2x2. 

II. În sectorul economic, unde se încadrează și lucrarea amintită, a fost utilizat  word2vec ca încorporare de cuvinte pentru a forma stratul de intrare al CNN-ului. Word2vec este utilizat pentru a construi matricea vectorială ce  caracterizează d.p.d.v. semantic fiecare cuvânt din intrare. În timp ce se află în  stratul de mapare, mai multe hărți cu caracteristici alcătuiesc unul dintre  straturile de calcul; o hartă caracteristică corespunde unui plan și toate ponderile  neuronilor de pe același plan sunt egale. Designul CNN l-a făcut un clasificator  adecvat pentru extragerea caracteristicilor semantice din textele corporale.  Descrierea detaliată a structurii convoluționale a modelului de rețea neuronală se  află în lucrarea atașată (Li et al., 2020). 

III. În sectorul comunicării virtuale, unde se încadrează lucrarea (Iftene et al., 2020), modelul CNN este utilizat pentru analiza în timp real a canalului  Twitter, dovedindu-se că el poate să ofere elemente cheie despre credibilitatea  tweet-urilor cât și a utilizatorilor care le-au postat. “Hărțile” utilizate aici  integrează informații culese de la utilizatori. Se crează astfel “imagini” în care se  pot apoi localiza “zonele”, adică postările și autorii lor, din care provin știrile  categorizate în false și non-false.

Referințe
  • (Simonyan and  Zisserman, 2015) Simonyan, Karen and Zisserman, Andrew (2015). Very Deep Convolutional Networks  for Large-Scale Image Recognition. In: International Conference on Learning  Representations - arXiv:1409.1556.
  • (Li et al., 2020) Youzhu Li, Huiling Zhou, Zhonglong Lin, Yifan Wang, Shunjie Chen, Chang Liu, Zhouyang Wang, Daniela Gifu, Jingbo Xia. Investigation in the influences of public opinion indicators on vegetable prices by corpora construction and WeChat article analysis. In: Future Generation Computer Systems, vol. 102, pages 876-888, 2020, https://www.sciencedirect.com/science/article/pii/S0167739X18327341
  • (Iftene et al., 2020) Adrian Iftene, Daniela Gîfu, Andrei-Remus Miron, Mihai-Ștefan Dudu. A Real-Time System for Credibility on Twitter. In: Proceedings of the 12th Language Resources and Evaluation Conference, pages 6166–6173, Marseille, France. European Language Resources Association, https://aclanthology.org/2020.lrec-1.757.pdf