Studentul moldovean care a dezvoltat un sistem de detectare a plagiatului

  • 27 июля 2018, 16:35
  • 571

Tînărul este absolvent al programului de studii „Securitate informațională" la Universitatea Tehnică din Moldova.

Sistematizînd și aplicînd în practică cunoștințele privind asigurarea integrității informației și dezvoltării produselor software, autorul proiectului a selectat instrumentele adecvate și a modelat arhitectura sistemului, limbajul de programare Python – instrumente optime pentru lucrul cu textul, căutarea, analiza, extragerea textului, iar codul programului are o capacitate de mentenanță și dezvoltare ridicată, scrie site-ul universității.

Sistemul a fost elaborat folosind modelul de programare paralelă, care, în combinație cu SGBD-ul Clickhouse creează o viteză sporită de detectare a similarităților în lucrări. SGBD-ul este mult mai rapid decît soluțiile relaționale sau orientate pe documente precum MySQL, PostgreSQL sau MongoDB, oferind totodată și o interfață de interacțiune compatibilă cu dialectul SQL, păstrînd viteza bazelor de date orientate pe coloane.

Pentru interfața web care are ca scop asigurarea unei interacțiuni ușoare și informative dintre utilizator și sistem s-a optat pentru framework-urile Flask și AngularJS. Ambele au un prag mic de asimilare, dar oferă vaste posibilități pentru construirea unei interfețe web dinamice, cu asigurarea întregului funcțional necesar unei interacțiuni productive cu sistemul.

Avantajele sistemului elaborat sînt: viteza mare de calculare a similarității documentelor, interfața web permite utilizarea sistemului fără intervenții adăugătoare pe server, dispune de posibilități de modificare a setărilor de funcționare, afișare, generare dinamică a rapoartelor, încărcare a documentelor în sistem și vizualizare a similarității acestora cu un design comod și informativ. Sistemul poate rula pe orice SO bazat pe nucleul Linux și nu necesită cheltuieli pentru procurarea licențelor pentru alte SO comerciale, este ușor de configurat pentru diferite necesități, fiind utilizat pentru verificarea similarității documentelor nu numai în instituții de învățămînt superior, dar și în alte domenii.

Aplicabilitatea și productivitatea sistemului dezvoltat în cadrul proiectului de licență sînt confirmate prin testarea acestuia pe baza lucrărilor de licență susținte la Universitatea Agrară de Stat din Moldova. Viteza s-a dovedit a fi de circa 50-100 de ori mai mare decît cele oferite de sistemele existente. Sistemul respectiv se află deja în proces de implementare la UTM, iar autorul a fost angajat în Direcția Tehnologia Informației și Comunicații, UTM anume cu acest scop.

Una din posibilitățile de dezvoltare ulterioară a sistemului ar putea fi aplicarea algoritmului MinHash, pentru a spori viteza de calculare a similarității, capacitatea de stocare a datelor și a micșora cantitatea de informație păstrată pentru un document, însă elaborarea acestui algoritm necesită mai mult timp – un scop pe care Grigore Cușnir și-l propune ca obiectiv în perspectivă.