首页>>后端>>Python->python中1G的模型要加载多久的简单介绍

python中1G的模型要加载多久的简单介绍

时间:2023-12-01 本站 点击:0

本篇文章首席CTO笔记来给大家介绍有关python中1G的模型要加载多久以及的相关内容,希望对大家有所帮助,一起来看看吧。

本文目录一览:

1、python跑10000个数据集要多久2、用python处理一个1G左右的数据集,运行速度非常慢,怎样优化3、Python使用easyocr模块完成图片文字识别

python跑10000个数据集要多久

看具体采集任务的内容,如果是图片,访问地址规范,熟悉规则,也就是一两分钟的事情,如果是复杂网页,并且反爬规则负杂可能需要半个小时,如果类似从天眼查爬取整个公司信息10000个,可能需要一两天,因为一个公司就需要n多信息

用python处理一个1G左右的数据集,运行速度非常慢,怎样优化

第一个办法,降低数据集的大小。python处理数据,如果数据结构中的数据超过2GB,通常都会很慢。如何降低数据集大小,需要修改算法。

第二个办法,将数据结构采用数组array或者是numarray存贮。这样内存数量与查找效率都会提高。尽量不要使用大的dict。使用一个省内存的blist代替list

第三个办法,将数据通过共享内存,让C++扩展模块来处理。

常用的是第二种办法。就是换个数据结构就可以提高效率。

Python使用easyocr模块完成图片文字识别

    EasyOCR实际上是一个python包,它将pytorch作为后端处理程序。EasyOCR像任何其他OCR(谷歌的tesseract或任何其他OCR)一样从图像中检测文本,但在我使用它的参考资料中,我发现它是从图像中检测文本的最直接的方法,而且高端深度学习库(pytorch)在后端支持它,这使它的准确性更可靠。EasyOCR支持42多种语言用于检测目的。

    可以在 easyocr · PyPI  上查看easyocr模块说明信息以及用法。

    easyocr.Reader设置语言列表,可以同时通过多种语言,但并非所有语言都可以一起使用,英语与每种语言兼容。将模型加载到内存中需要一些时间,但它只需要运行一次。

    比如下面的设置语言,可根据图片中的文字类别来选择。

reader_ch_tra = easyocr.Reader(['ch_tra', 'en']),指定繁体中文和英语

reader_ch_sim = easyocr.Reader(['ch_sim', 'en']),指定简体中文和英语

reader_ch_en = easyocr.Reader(['en']),指定英语

1、标牌文字识别

    可以指定detail = 0来简单的输出。

    可以在命令行中调用easyocr工具来实现命令行解析。

2 、车牌识别

3 、验证码识别

4、长篇文字

结语:以上就是首席CTO笔记为大家介绍的关于python中1G的模型要加载多久和的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/Python/5818.html