Un student de la UTM a dezvoltat un sistem de detectare a plagiatului în lucrările științifice. Cum funcționează acesta

IMG_20180608_142248-845×684

Dacă unii studenți mai recurg la plagiat atunci când își scriu teza de licență, atunci Grigore Cușnir a ales pentru lucrarea sa de licență să dezvolte un sistem de detectare a plagiatului în lucrările științifice. Tânărul este absolvent al programului de studii „Securitate informațională” la Universitatea Tehnică din Moldova.

Sistematizând și aplicând în practică cunoștințele privind asigurarea integrității informației și dezvoltării produselor software, autorul proiectului a selectat instrumentele adecvate și a modelat arhitectura sistemului, limbajul de programare Python – instrumente optime pentru lucrul cu textul, căutarea, analiza, extragerea textului, iar codul programului are o capacitate de mentenanță și dezvoltare ridicată, scrie site-ul universității.

Sistemul a fost elaborat folosind modelul de programare paralelă, care, în combinație cu SGBD-ul Clickhouse creează o viteză sporită de detectare a similarităților în lucrări. SGBD-ul este mult mai rapid decât soluțiile relaționale sau orientate pe documente precum MySQL, PostgreSQL sau MongoDB, oferind totodată și o interfață de interacțiune compatibilă cu dialectul SQL, păstrând viteza bazelor de date orientate pe coloane.

Pentru interfața web care are ca scop asigurarea unei interacțiuni ușoare și informative dintre utilizator și sistem s-a optat pentru framework-urile Flask și AngularJS. Ambele au un prag mic de asimilare, dar oferă vaste posibilități pentru construirea unei interfețe web dinamice, cu asigurarea întregului funcțional necesar unei interacțiuni productive cu sistemul.

Avantajele sistemului elaborat sunt: viteza mare de calculare a similarității documentelor, interfața web permite utilizarea sistemului fără intervenții adăugătoare pe server, dispune de posibilități de modificare a setărilor de funcționare, afișare, generare dinamică a rapoartelor, încărcare a documentelor în sistem și vizualizare a similarității acestora cu un design comod și informativ. Sistemul poate rula pe orice SO bazat pe nucleul Linux și nu necesită cheltuieli pentru procurarea licențelor pentru alte SO comerciale, este ușor de configurat pentru diferite necesități, fiind utilizat pentru verificarea similarității documentelor nu numai în instituții de învățământ superior, dar și în alte domenii.

Aplicabilitatea și productivitatea sistemului dezvoltat în cadrul proiectului de licență sunt confirmate prin testarea acestuia pe baza lucrărilor de licență susținte la Universitatea Agrară de Stat din Moldova. Viteza s-a dovedit a fi de circa 50-100 de ori mai mare decât cele oferite de sistemele existente. Sistemul respectiv se află deja în proces de implementare la UTM, iar autorul a fost angajat în Direcția Tehnologia Informației și Comunicații, UTM anume cu acest scop.

Una din posibilitățile de dezvoltare ulterioară a sistemului ar putea fi aplicarea algoritmului MinHash, pentru a spori viteza de calculare a similarității, capacitatea de stocare a datelor și a micșora cantitatea de informație păstrată pentru un document, însă elaborarea acestui algoritm necesită mai mult timp – un scop pe care Grigore Cușnir și-l propune ca obiectiv în perspectivă.

Share: Share on Facebook Share on Twitter Share on Telgram
Comentarii
  • Știri pentru tine
  • Lifestyle din stânga nistrului

  • Portalul CIVIC.MD: Activitati ONG, anunturi, granturi, job-uri, voluntariat, evenimente