计算机视觉库/人脸识别PySOT、Pythia、PyTorch Geometry介绍

以下为你介绍的计算机视觉库/人脸识别软件都可用在Linux系统上:PySOT(计算机视觉、视觉跟踪算法库)、Pythia(视觉问答研究模块化框架)、PyTorch Geometry(基于 Pytorch 的计算机视觉库)。

1、PySOT(计算机视觉、视觉跟踪算法库)

计算机视觉库/人脸识别PySOT、Pythia、PyTorch Geometry介绍

PySOT 是由 SenseTime 视频情报研究团队设计的软件系统。它实现了最先进的单一对象跟踪算法,包括 SiamRPN 和 SiamMask。它是用 Python 编写的,由 PyTorch 深度学习框架提供支持。该项目还包含用于评估跟踪器的 Python 工具包端口。

上图是SiamFC、SiamRPN 和 SiamMask 输出示例。

PySOT 的目标是为视觉跟踪研究提供高质量、高性能的代码库。它旨在灵活,以支持新颖研究的快速实施和评估。

PySOT 包括以下视觉跟踪算法的实现:

SiamMask、SiamRPN ++、DaSiamRPN、SiamRPN、SiamFC。

使用以下骨干网络架构:

ResNet {18,34,50}、MobileNetV2、AlexNet。

将PySOT添加到您的PYTHONPATH:

export PYTHONPATH=/path/to/pysot:$PYTHONPATH

下载模型:

在PySOT Model Zoo中下载模型,并将model.pth放入实验中的正确目录。

网络摄像头演示:

python tools/demo.py \

 --config experiments/siamrpn_r50_l234_dwxcorr/config.yaml \

 --snapshot experiments/siamrpn_r50_l234_dwxcorr/model.pth

 # --video demo/bag.avi # (in case you don't have webcam)

下载地址:https://github.com/STVIR/pysot

2、Pythia(视觉问答研究模块化框架)

计算机视觉库/人脸识别PySOT、Pythia、PyTorch Geometry介绍

Pythia 是 Facebook 人工智能研究(Facebook AI Research,FAIR)的视觉问答研究模块化框架,它建立在 PyTorch 之上。Pythia 还可以作为视觉和语言数据集挑战的入门代码库(TextVQA 挑战、VQA 挑战)。

特性:

Model Zoo:最先进的视觉和语言模型的参考实现,包括 LoRRA(SoQ on VQA 和 TextVQA)、Pythia 模型(VQA 2018 挑战获胜者)和 BAN。

Multi-Tasking:支持多任务,允许同时训练多个数据集。

Datasets:包括对内置的各种数据集的支持,包括 VQA、VizWiz、TextVQA 和 VisualDialog。

Modules:为视觉和语言领域中的许多常用图层提供实现

Distributed:支持基于 DataParallel 和 DistributedDataParallel 的分布式培训。

Unopinionated:对于基于它构建的数据集和模型实现不受影响。

Customization:可自定义损失、指标、调度、优化器、张量板等等。

入门:

git clone https://github.com/facebookresearch/pythia ~/pythia

# 您也可以创建自己的conda环境,然后进入此步骤

cd ~/pythia

python setup.py develop

现在,Pythia应该可以使用了,按照特定部分中的步骤开始使用Pythia训练自己的模型。

下载地址:https://github.com/facebookresearch/pythia

3、PyTorch Geometry(基于 Pytorch 的计算机视觉库)

Torch Geometry 是基于 PyTorch 的计算机视觉库,用于解决通用计算机几何数学问题。该库基于 PyTorch,用于提高定义反向模式自动微分(reverse-mode auto-differentiation)和计算复杂函数梯度。

注明

以上就是计算机视觉库/人脸识别PySOT、Pythia、PyTorch Geometry的介绍内容,这些计算机视觉库/人脸识别软件都能使用在Linux操作系统中。

栏目相关文章