# python

在实际操作中,我们常常会从文件中输入和输出,在这个时候我们就需要调用相关的函数进行读取和写入操作,在下面就记录几种较为常用的方式

阅读全文 »

# python

# 图形处理

python中的OCR工具

此内容是直接询问ai + 查询相关资料学习到的,只能说ai确实改变了原有的常规学习方式

在python中可以很好地实现图片的处理以及进行OCR文字识别,所以说我们选择使用python进行文字的识别。

为了实现我们的目标,我们需要使用到OpenCV库来处理图像,并使用Tesseract OCR进行字符识别。

预备工作

Tesseract OCR 除了需要import还需要下载他们的本地工具,我们可以在他们的github上找到适用于window的安装程序

pytesseract · PyPI | 查看python库详情

pip import pytesseract 安装库

然后在 Introduction | tessdoc (tesseract-ocr.github.io) 里面找到你想要的版本,会跳转到相应的下载位置。

下载完成之后将下载位置的基础目录加入PATH 然后重启电脑。

关于的详细运用可以看看tesseract-ocr,基本安装配置,以及python中如何使用?_哔哩哔哩_bilibili

过程分析

在这里我们的目标是将原有图片截取所需部分,然后进行文字的识别

在这里先是使用cv2 进行图片处理,然后对于处理后的图片使用了pytesseract 作为文字识别的工具,调用了pytesseract.image_to_string(img, lang='eng', config='--psm 6') 进行文字识别

代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
import cv2
import pytesseract
import matplotlib.pyplot as plt # plt 用于显示图片
# 读取图片

img = cv2.imread('test.jpg')
# 定义要提取的区域,这里我们假设我们要从左上角开始,提取50x50的矩形区域
top_left_x = 100
top_left_y = 100
dx = 50
dy = 50
bottom_right_x = top_left_x + dx
bottom_right_y = top_left_y + dy

# 提取区域
crop_img = img[top_left_y:bottom_right_y, top_left_x:bottom_right_x]

# 将灰度转换为黑白,提高识别率
gray = cv2.cvtColor(crop_img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]

# 使用Tesseract进行字符识别
data = pytesseract.image_to_string(thresh, lang='eng', config='--psm 6')

print(data)

# 如果有多个区域需要识别,可以将上述代码放在循环中
阅读全文 »

# 未完成

考研数学是指在中国大陆地区研究生入学考试中的一种专业课程考试科目,其目的是测试考生在数学方面的基本理论知识、基本技能和运用能力。它包含高等数学、线性代数、概率论和数理统计四个部分。

阅读全文 »

# 效率工具

这是我个人 结合多种方法,按照自己经常使用的工具制定的一个管理方法。这种方法以四象限为基础模板,将事项的状态以及事项的拆解结合到一起,是一种较为不错的时间管理工具。

一、【4】-4时间管理法

第一个四指的是四象限,按照【重要性】【紧迫性】可以将所有的事项分为四类

  • 重要紧迫
  • 重要但是不紧迫
  • 紧迫但是不重要
  • 不重要不紧迫

可以发现,在处理 重要但是不紧迫紧迫但是不重要 这两种事情的时候,我们优先选择做重要但是不紧迫 的内容。实际上,这一选择符合人们关于“未雨绸缪”的设计,而人们完成 重要但是不紧迫的事情的数量的多少其实才是一个人通过这种方法获得了多少的最好指标。

二、 4-【4】时间管理法

本来是我自己设计的,但是后面回合GTD时间管理法一对照,发现其实有许多相似之处,但是实际上我的这个更加贴近实际的运行,并且包含更加清晰地时间拆解。

1. 结构构成

这里的4指的是事项的四种状态(虽然说其实不止四种):

  • A有这个想法去做
  • B思路清晰准备做
  • C事项
  • D归档
    • 已完成待归档
    • 已归档

2. 具体操作

  1. 收集:每次有想法了之后,写在A区,并且按照四象限进行分类。
  2. 处理拆分:然后将A区,按照:【1. 重要紧迫2. 重要但是不紧迫3. 紧迫但是不重要4. 不重要不紧迫】的顺序进行拆分,想想看自己具体要怎么实现这些目标,将这些目标拆解成小的目标,并且放入B区
  3. 具体落地:B区一般会有两种事项构成:长期的“项目”,和短期的“事项”。对于项目,我们可以结合你的任务清单记录工具,提醒自己每天去进行跟进。对于事项,直接创建事项后续安排时间完成即可。
    需要注意的是尽可能地给你的项目/事项标注好时间完成的指标是什么,因为这样的话,你在安排时间完成的时候就可以有一个具体的参考,以及在完成事项的时候有一个具体的反馈。一定要有指标,不然的话你可能会因为自己临时定的目标过于理性,而使得完成后反而会有一种挫败感。
    另外,你还要知道,拆解项目的时候项目的状态并不是一成不变的,所有项目的拆分应该随着项目的状态变化而进行调整:比如我本来预计有三轮工作,但是我发现我两轮下来就已经基本完成了,那么这个时候我们就需要对第三轮的事情进行一定的调整。
  4. 处理事项:预估你想要专注的时间,比对一下你在任务清单中标注的时间,你可以很轻松地设计这段时间需要干什么。
  5. 归档:所有完成的任务事项都需要归档,写一份文档记录你在这次事项中学到了什么东西,发现了什么问题……

三、结合番茄闹钟

在我的定义里面,番茄闹钟指的是每隔25分钟会提醒一次,之后过5分钟的时候又会提醒一次的闹钟。

这样可以使你对时间拥有更好的掌握感但是又尽可能的不去打乱你当前的节奏,并且使你间歇性的暂停一下,让你能够在这几分钟之内对刚刚25min做的事情进行一个快速的回顾以及为下一个25min调整状态。

阅读全文 »

# 杂谈

# 效率工具

GTD时间管理法

GTD时间管理法,全称为“go to done”今天学习了GTD时间管理法的原理应用等等等等,总而言之,感觉不是很好用。

阅读全文 »
0%