Виявлення об’єктів в процесі розпізнавання зображень за допомогою трансформерів
DOI:
https://doi.org/10.32626/2308-5916.2022-23.83-90Анотація
Проаналізовано сучасні методи виявлення об’єктів в процесі розпізнавання зображень за допомогою технології трансформера.
Означено переваги та недоліки різних методів. Створено власну мережу на основі трансформера DETR від FAIR team, проаналізовано його роботу. Зроблено порівняння продуктивності трансформерних мереж із оптимізованими архітектурами згорткових нейронних мереж.
В процесі досліджень були використані засоби хмарних обчислень, графічні процесори, кластери Інтернету речей або вбудовані мікропроцесорні системи.
Для забезпечення високої точності детектора об’єктів та результатів виявлення в реальному часі на різних типах пристроїв розроблено ефективний детектор об’єктів і необхідна техніка для масштабування моделі.
Поетапно проілюстровано процес навчання моделі трансформера.
Завантаження
Посилання
Carion N., Massa F., Synnaeve G., Usunier N., Kirillov A., Zagoruyko S. End-to-End Object Detection with Transformers. arXiv: 2005.12872v3 [cs.CV] 28 May 2020. P. 1-26. URL: https://arXiv.org/pdf/2005.12872.pdf.
Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao. Scaled-YOLOv4: Scaling Cross Stage Partial Network. arXiv: 2011.08036v2 [cs.CV] 22 Feb 2021. P. 1-10. URL: https://arXiv.org/pdf/2011.08036.pdf.
Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. arXiv: 2016.1506.01497v3 [cs.CV] 6 Jan 2016. P. 1-14. URL: https://arXiv.org/pdf/1506.01497.pdf.
Goodfellow I., Bengio Yo., Courville A. Deep Learning. A MIT Press Book. MIT Press. 2016. 716 p.
DETR: End-to-End Object Detection with Transformers. URL: https://github.com/facebookresearch/detr
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори, які публікуються в цьому журналі, погоджуються з наступними умовами:
Автори зберігають авторські права та надають журналу право першої публікації роботи, одночасно ліцензованої за ліцензією Creative Commons Attribution License, яка дозволяє іншим поширювати роботу з посиланням на авторство роботи та її першу публікацію в цьому журналі.
Автори можуть укладати окремі додаткові договірні угоди щодо неексклюзивного розповсюдження опублікованої в журналі версії роботи (наприклад, розміщувати її в інституційному репозиторії або публікувати в книзі) з посиланням на її першу публікацію в цьому журналі.
Авторам дозволяється та заохочується публікувати свої роботи онлайн (наприклад, в інституційних репозиторіях або на своєму вебсайті) до та під час процесу подання, оскільки це може призвести до продуктивного обміну, а також до більш раннього та більшого цитування опублікованих робіт (див. The Effect of Open Access).