Pubg Mobile提出的问题 -coding

Pubg Mobile

Asked: 2025-03-22 15:34:01 +0800 CST

Converta arquivos PDF de várias páginas para PNG rapidamente

6

Tenho uma pasta contendo 600 arquivos PDF , e cada PDF tem 20 páginas . Preciso converter cada página em um PNG de alta qualidade o mais rápido possível.

Eu escrevi o seguinte script para esta tarefa:

import os
import multiprocessing
import fitz  # PyMuPDF
from PIL import Image

def process_pdf(pdf_path, output_folder):
    try:
        pdf_name = os.path.splitext(os.path.basename(pdf_path))[0]
        pdf_output_folder = os.path.join(output_folder, pdf_name)
        os.makedirs(pdf_output_folder, exist_ok=True)

        doc = fitz.open(pdf_path)

        for i, page in enumerate(doc):
            pix = page.get_pixmap(dpi=850)  # Render page at high DPI
            img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)
            
            img_path = os.path.join(pdf_output_folder, f"page_{i+1}.png")
            img.save(img_path, "PNG")

        print(f"Processed: {pdf_path}")
    except Exception as e:
        print(f"Error processing {pdf_path}: {e}")

def main():
    input_folder = r"E:\Desktop\New folder (5)\New folder (4)"
    output_folder = r"E:\Desktop\New folder (5)\New folder (5)"

    pdf_files = [os.path.join(input_folder, f) for f in os.listdir(input_folder) if f.lower().endswith(".pdf")]

    with multiprocessing.Pool(processes=multiprocessing.cpu_count()) as pool:
        pool.starmap(process_pdf, [(pdf, output_folder) for pdf in pdf_files])

    print("All PDFs processed successfully!")

if __name__ == "__main__":
    main()

Emitir:

Este script é muito lento , especialmente ao processar um grande número de PDFs. Tentei as seguintes otimizações, mas elas não melhoraram a velocidade significativamente :

DPI reduzido ligeiramente – Reduzido de 1200 DPI para 850 DPI . (Eu também testei 600-800 DPI.)
Habilitado alpha=False em get_pixmap() – Uso de memória reduzido.
Usado ThreadPoolExecutor em vez de multiprocessing.Pool – Nenhuma melhoria significativa.
Compressão PNG reduzida – Definida optimize=Falseao salvar imagens.
Imagens convertidas em tons de cinza – Ajudou um pouco, mas preciso de imagens coloridas para minha tarefa.

Possíveis soluções que considerei:

Processamento paralelo de páginas em vez de arquivos – Em vez de processar um arquivo por vez, processe cada página em paralelo para utilizar totalmente os núcleos da CPU.
Use ProcessPoolExecutor em vez de ThreadPoolExecutor – Como a renderização exige muita CPU , o multiprocessamento deve ser melhor.
Use JPEG em vez de PNG – JPEG é muito mais rápido de salvar e ocupa menos espaço de armazenamento, mas preciso de imagens de alta qualidade .
Reduzir DPI para 500-600 – Oferece um equilíbrio entre velocidade e qualidade .
Grave arquivos em lote em vez de salvar um por um – Reduz a sobrecarga de E/S.

Com o que preciso de ajuda:

Como posso acelerar significativamente essa conversão de PDF para PNG mantendo alta qualidade de imagem?
Existem bibliotecas ou técnicas melhores que eu deva usar?
Existe uma maneira de utilizar totalmente os núcleos da CPU de forma eficiente?

Qualquer sugestão será muito apreciada!

Pubg Mobile

Asked: 2024-09-10 13:57:21 +0800 CST

Detectar apenas caixas mais à esquerda na imagem

5

Tenho uma imagem JPG que contém nomes de marcas de dispositivos móveis:

Agora quero detectar o primeiro caractere de cada palavra pelo script python.
Escrevi o seguinte script python para isso:

import cv2
import numpy as np
from tkinter import Tk, Canvas, Frame, Scrollbar, BOTH, VERTICAL, HORIZONTAL
from PIL import Image, ImageTk

# Function to draw rectangles around shapes and display using Tkinter
def draw_rectangles(image_path):
    # Create a Tkinter window to display the image
    root = Tk()
    root.title("Image with Left-Most Rectangles Only")

    # Load the image
    image = cv2.imread(image_path)
    # Convert the image to grayscale
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # Apply adaptive thresholding to get better separation of text
    thresh = cv2.adaptiveThreshold(
        gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 11, 2
    )

    # Find contours in the binary image
    contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # Dictionary to store contours grouped by Y-coordinate ranges
    contours_by_y = {}

    # Sort contours by X-coordinate to ensure we pick the left-most character first
    sorted_contours = sorted(contours, key=lambda c: cv2.boundingRect(c)[0])

    # Group contours by their Y coordinate to keep only the left-most rectangle per Y range
    for contour in sorted_contours:
        x, y, w, h = cv2.boundingRect(contour)
        if w > 15 and h > 15:  # Adjust the size filter to remove small artifacts
            aspect_ratio = w / float(h)
            # Ensure the aspect ratio is within the typical range of letters
            if 0.2 < aspect_ratio < 5:
                y_range = y // 20  # Group by a smaller Y coordinate range for better separation

                # Check if the current rectangle is more left-most in X within its Y range
                if y_range not in contours_by_y:
                    contours_by_y[y_range] = (x, y, w, h)  # Store the first contour found in this range
                else:
                    # Compare and keep the left-most (smallest X) rectangle
                    current_x, _, _, _ = contours_by_y[y_range]
                    # Check distance between new contour and the existing one to avoid close detection
                    if x < current_x and (x - current_x) > 20:  # Distance threshold to filter out close contours
                        contours_by_y[y_range] = (x, y, w, h)

    # Draw only the left-most rectangles
    for (x, y, w, h) in contours_by_y.values():
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)  # Red color in BGR

    # Convert the image to RGB (OpenCV uses BGR by default)
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

    # Convert the image to a format Tkinter can use
    image_pil = Image.fromarray(image_rgb)
    image_tk = ImageTk.PhotoImage(image_pil)

    # Create a frame for the Canvas and scrollbars
    frame = Frame(root)
    frame.pack(fill=BOTH, expand=True)

    # Create a Canvas widget to display the image
    canvas = Canvas(frame, width=image_tk.width(), height=image_tk.height())
    canvas.pack(side="left", fill="both", expand=True)

    # Add scrollbars to the Canvas
    v_scrollbar = Scrollbar(frame, orient=VERTICAL, command=canvas.yview)
    v_scrollbar.pack(side="right", fill="y")

    h_scrollbar = Scrollbar(frame, orient=HORIZONTAL, command=canvas.xview)
    h_scrollbar.pack(side="bottom", fill="x")

    canvas.configure(yscrollcommand=v_scrollbar.set, xscrollcommand=h_scrollbar.set)
    canvas.create_image(0, 0, anchor="nw", image=image_tk)
    canvas.config(scrollregion=canvas.bbox("all"))

    # Keep a reference to the image to prevent garbage collection
    canvas.image = image_tk

    root.mainloop()

# Path to your image
image_path = r"E:\Desktop\mobile_brands\ORG_027081-Recovered.jpg"

# Call the function
draw_rectangles(image_path)

Mas não sei por que não está funcionando bem. A precisão desse script é de 90%. Por exemplo, na imagem acima, ele detecta o caractere "a" em "Samsung"

onde está o problema do meu script?
Como posso consertar esse problema?
talvez pela coordenada Y e X não consiga detectar as caixas mais à esquerda na imagem.
Note que não quero usar OCR

Pubg Mobile

Asked: 2024-07-26 20:49:28 +0800 CST

Marcar linhas entre dois padrões Regex no Notepad ++ sem incluir os próprios padrões [duplicado]

4

Eu tenho uma lista e aqui está um trecho de exemplo:

Newii
27,807,147
Supd
26,518,465
Ns.
26,175,538
Mai
24,930,812
Gas
0623,901,055
TEim
20,213,631
Tes
GrV
18,968,412
Mytyttyst
y
htththt
hyhyh
October 2013
/////////////////////////

Quero marcar as linhas entre 18,968,412e October 2013sem incluir essas linhas. O seguinte regex funciona bem para combinar as linhas:

^\d+(?:,\d+)*$(?=(?:\R(?!\d+(?:,\d+)*$).*)*\R/{3,}$)[\s\S]+?^\h*\S.*(?=\R+/{24})

Este regex coloca [\s\S]+?entre ^\d+(?:,\d+)*$(?=(?:\R(?!\d+(?:,\d+)*$).*)*\R/{3,}$)e ^\h*\S.*(?=\R+/{24}). No entanto, o problema é que ele também marca as próprias linhas do padrão.

A saída fica depois de aplicar o "marcador":

18,968,412
Mytyttyst
y
htththt
hyhyh
October 2013

Quero marcar apenas as linhas entre os dois padrões. Por exemplo, na lista acima, as linhas que devem ser marcadas são:

Mytyttyst
y
htththt
hyhyh

Alguém pode me ajudar a modificar o regex para que ele marque apenas as linhas entre os padrões, sem incluir as próprias linhas do padrão?

Observe que tentei seguir o regex, mas eles também não funcionaram!

(?<=^\d+(?:,\d+)*$\R)[^\R]*(\R(?!^\d+(?:,\d+)*$|\h*\S.*(?=\R/{24}))[^R]*)*(?=\R^\h*\S.*(?=\R/{24}))
(?<=^\d+(?:,\d+)*$(?=(?:\R(?!\d+(?:,\d+)*$).*)*\R/{3,}$)\R)([\s\S]*?)(?=\R^\h*\S.*(?=\R+/{24}))
(?<=^\d+(?:,\d+)*$(?=(?:\R(?!\d+(?:,\d+)*$).*)*\R/{3,}$)\R)[\s\S]*?(?=\R^\h*\S.*(?=\R+/{24}))
(?<=^\d+(?:,\d+)*$(?=(?:\R(?!\d+(?:,\d+)*$).*)*\R/{3,}$))[\s\S]*?(?=^\h*\S.*(?=\R+/{24}))

Pubg Mobile

Asked: 2024-06-28 14:43:53 +0800 CST

Como marcar números percentuais normais e decimais no Notepad ++?

5

Estou tentando marcar linhas que contêm números percentuais no Notepad++. Especificamente, quero marcar porcentagens de números inteiros (como 9%) e porcentagens decimais (como 4,5%).

por exemplo, tenho a seguinte lista:

VitrtertWW
44.98%
Liertertde
32.52%
Ltettth
Ltertrth9%
Mhrhrththw
4.5%
1992Q2
/////////////////////////

Quero mover todos os números percentuais para a próxima linha.
seguinte regex está funcionando bem:

Find: \d+\.\d+%
Replace: \n$0

mas meu regex tem um problema. Ele apenas move os números percentuais decimais para a próxima linha e os números percentuais normais não passam para a próxima linha.
Como consertar esse problema?

Tentei seguir expressões regulares também, mas não funcionou:

(?<!\d)\d%(?!\d)
(|\s)\d%(\s|$)

Pubg Mobile

Asked: 2024-01-02 18:49:29 +0800 CST

Marque linhas consecutivas que tenham o mesmo valor específico

5

Eu tenho uma lista como a seguinte:

ABC
GFGFG
/////////////////////////
ggtrgrh
htrhrth
nbtnyumjyumu
myuuykukyyuk
/////////////////////////
/////////////////////////
AAAAA
AAAAAAAAAAA
RET5t4yy
HTH^565y56y
/////////////////////////
tertet
/////////////////////////
/////////////////////////
/////////////////////////

agora quero marcar linhas consecutivas que tenham /////////////////////////
essa média apenas na lista acima three last linese nas linhas intermediárias myuuykukyyuke AAAAAdevo selecionar por regex.
Tentei seguir o regex, mas não funcionou para mim:

(?:.*/{25,}\r?\n?){3}
^/*/{25,}$

onde está meu problema de regex?

Quero corresponder apenas duas ou mais linhas que contenham apenas 25 ou mais barras

Pubg Mobile

Asked: 2024-01-02 13:44:46 +0800 CST

Como marcar linhas antes e depois de uma regex corresponder até uma linha específica?

6

Sinto muito pelo título deste post, mas não encontrei um título melhor para este problema.
Eu tenho uma lista como a seguinte:

/////////////////////////
Mitnhnhnksmuion
2,687,064
Etyjyjes
1,897,331
Pihjloyd
1,466,137
Edddlnnnnney
1,297,624
Thjtyjkujkes
1,241,307
Fnnhhnac
1,159,710
AfdBhhhghghBA
1,113,062
Elnhhyhjkukjhn
1,023,500
Bggggggel
1,009,075
Letjyjnhhtrh
991,284
Bahtyjtjyjd
849,265
1980Q4
/////////////////////////
Eayes
4,228,223
Elhyjtyjey
1,456,729
1,412,750
Lein
243
184
AA
1,129
672
Elejntyj345hn
002,570
Neerthty34ond
916
78
Biwertetoel
910,353
Qen
874,812
Bs
877,293
Pyd
850,146
1978Q1
/////////////////////////
Mteichrtertson
2,747,969
Eatertglertees
1,885,332
Pirtertd
1,490,156
Elverts
1,295,789
TtrrheBerteaerttles
1,239,194
Fleterteter
1,156,907
ABB
1,117,183
E
1,027,583
Bi
1,010,372
LedZ
987,821
Barb
850,687
1980Q4
/////////////////////////

seguinte regex marca algumas das linhas da lista acima:

(?:^|\R)\K\d+(?:,\d+)*\R\d+(?:,\d+)*(?=\R)

linhas marcadas com este regex:

mas eu não gosto disso! Quero marcar minhas seções de correspondências de regex.
por exemplo, quero marcar a seguinte seção na minha lista:

/////////////////////////
Eayes
4,228,223
Elhyjtyjey
1,456,729
1,412,750
Lein
243
184
AA
1,129
672
Elejntyj345hn
002,570
Neerthty34ond
916
78
Biwertetoel
910,353
Qen
874,812
Bs
877,293
Pyd
850,146
1978Q1
/////////////////////////

Tentei seguir o regex, mas não funcionou para mim:

^/////////////////////////\R((?:(?!^/////////////////////////).)*)\R\d+(?:,\d+)*\R\d+(?:,\d+)*(?=\R)
^(?:(?!^/////////////////////////).)*\R\d+(?:,\d+)*\R\d+(?:,\d+)*(?=\R/////////////////////////)

como fazer isso por regex no notepad++?
em outras palavras, regex deve marcar todas as linhas antes de minhas correspondências de regex até a inclusão da última linha /////////////////////////e todas as linhas após minha correspondência de regex até a inclusão da primeira linha/////////////////////////

Pubg Mobile

Asked: 2023-11-10 23:48:30 +0800 CST

Como inverter áreas regex no notepad++?

5

Eu tenho a seguinte lista:

  <th class="News">14</th>
  <td class="News"><a href="pclinuxos">PCLinuxOS</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 341">341<img src="/web/20050131094820im_/http://distrowatch.com/images/other/alevel.png" alt="=" title="Yesterday: 341"></td>
</tr>
<tr>
  <th class="News">15</th>
  <td class="News"><a href="redhat">Red Hat</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 290">289<img src="/web/20050131094820im_/http://distrowatch.com/images/other/adown.png" alt=">" title="Yesterday: 290"></td>
</tr>
<tr>
  <th class="News">16</th>
  <td class="News"><a href="slax">SLAX</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 274">275<img src="/web/20050131094820im_/http://distrowatch.com/images/other/aup.png" alt="<" title="Yesterday: 274"></td>
</tr>
<tr>
  <th class="News">17</th>
  <td class="News"><a href="vine">Vine</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 269">261<img src="/web/20050131094820im_/http://distrowatch.com/images/other/adown.png" alt=">" title="Yesterday: 269"></td>
</tr>
<tr>

Posso selecionar minhas linhas de destino seguindo regex:

(.*)\R.+\.png" alt\b

Agora quero inverter minhas linhas de destino usando regex.
Usei ^(?!.*(.*)\R.+\.png" alt\b).+\Rregex para inverter, mas falhei e obtive o seguinte resultado!

Por que meu regex inverte apenas uma das linhas? onde está o problema?

Pubg Mobile

Asked: 2023-09-07 00:26:24 +0800 CST

Mantenha apenas o número nas linhas regex

6

Eu tenho uma lista que a seguir é um exemplo da minha lista:

Bolt

®1421918Users

Classmates

666138Users

SixDegrees

470621Users$$

PlanetAll

AT308079Users

theGlobe

214442Users

1997

Agora quero manter apenas number Usersas Userslinhas
. Por exemplo:

Bolt

1421918Users

Classmates

666138Users

SixDegrees

470621Users

PlanetAll

308079Users

theGlobe

214442Users

1997

Tentei seguir regex no notepad++ mas não funcionou:

Find What = ^.*?(\d+Users)
Replace = \1

e tentei seguir o regex:

Find What = ^(?!\d+Users).*\r?\n?
Replace = [Empty]

Como corrigir esse problema de regex?

Pubg Mobile

Asked: 2023-09-06 00:44:35 +0800 CST

Mover as últimas linhas para a primeira linha

1

Tenho um grande número de arquivos txt no E:\Desktop\Social_media\edit8\New folder (2)diretório e cada arquivo tem uma organização como a seguir:

Bolt;539,110
Classmates;263,454
PlanetAll;126,907
theGlobe;73,063
SixDegrees;64,065
JANUARY 1997

Agora quero mover as últimas linhas para a primeira linha como segue:

JANUARY 1997
Bolt;539,110
Classmates;263,454
PlanetAll;126,907
theGlobe;73,063
SixDegrees;64,065

Eu escrevo o seguinte script python para isso:

import os

directory = r'E:\Desktop\Social_media\edit8\New folder (2)'  # Replace with the directory path containing your text files

# Get a list of all text files in the directory
files = [file for file in os.listdir(directory) if file.endswith('.txt')]

# Process each file
for file in files:
    file_path = os.path.join(directory, file)
    
    # Read the file content
    with open(file_path, 'r') as f:
        lines = f.readlines()
    
    # Extract the last line and strip the newline character
    last_line = lines.pop().strip()
    
    # Insert the last line at the beginning
    lines.insert(0, last_line)
    
    # Write the modified content back to the file
    with open(file_path, 'w') as f:
        f.writelines(lines)

Meu script está funcionando bem, mas não sei por que ele move a última linha para a primeira da primeira linha, como segue:

JANUARY 1997Bolt;539,110
Classmates;263,454
PlanetAll;126,907
theGlobe;73,063
SixDegrees;64,065

Onde está meu problema de script? e como consertar isso?

Pubg Mobile

Asked: 2023-09-06 00:09:57 +0800 CST

Mesclar as últimas 3 linhas de cada arquivo de texto com uma disposição específica

6

Tenho um grande número de arquivos txt no E:\Desktop\Social_media\edit8\New folderdiretório e cada arquivo tem uma organização semelhante à seguinte:

Bolt
2,739,393
Classmates
1,267,092
SixDegrees
1,077,353
PlanetAll
552,488
theGlobe
437,847
OpenDiary
9,251
1998
MARCH
034+

Agora quero mesclar cada arquivo txt nas últimas 3 linhas, como segue:

Bolt
2,739,393
Classmates
1,267,092
SixDegrees
1,077,353
PlanetAll
552,488
theGlobe
437,847
OpenDiary
9,251
034+ MARCH 1998

isso significa que as últimas 3 linhas devem ter um arranjo comonumber+ month year

Eu escrevo o seguinte script python para isso, mas não sei por que não está funcionando:

import os

# Define the directory where your text files are located
directory_path = r'E:\Desktop\Social_media\edit8\New folder'

# Function to rearrange the lines and write to a new file
def rearrange_lines(file_path):
    with open(file_path, 'r') as file:
        lines = [line.strip() for line in file.readlines() if line.strip()]  # Read non-empty lines

    # Check if there are at least 3 non-empty lines
    if len(lines) >= 3:
        lines[-1], lines[-2], lines[-3] = lines[-3], lines[-2], lines[-1]  # Rearrange the last 3 lines

        # Create a new file with the rearranged lines
        with open(file_path, 'w') as file:
            file.write('\n'.join(lines))

# Iterate through each file in the directory
for root, dirs, files in os.walk(directory_path):
    for file_name in files:
        if file_name.endswith('.txt'):
            file_path = os.path.join(root, file_name)
            rearrange_lines(file_path)
            print(f'Rearranged lines in {file_name}')

print('Done!')

Onde está meu problema de script? e como resolver o problema?

Pubg Mobile

Asked: 2023-09-04 01:27:14 +0800 CST

Marcar linhas consecutivas não vazias que começam e terminam com um regex

7

Na lista a seguir, quero selecionar linhas consecutivas não vazias que começam e terminam com^(?!.*\+\s*$).*?(?<!\d)(?<!\d,)(\d{1,3}(?:,\d{3})*)(?!,?\d).*

1,754,085

Bolt

817,653

classmates

cm

623,592

SixDegrees

PlanetAll

361,908

274,553

274,493

1997

SEPTEMBER

021+

Na lista acima, quero selecionar apenas as seguintes linhas:

como posso fazer isso por regex no notepad++?

Pubg Mobile

Asked: 2023-08-18 03:28:20 +0800 CST

Faça uma nova linha após 3 caracteres após regex

5

Eu tenho a seguinte lista:

Intel(USA)
Pfizer(USA)6
GeneralElectric(USA)43
Alphabet(Google)(USA)

Posso selecionar o mais recente (em cada linha por ^.*\K\((?=[^(]*$)regex.
Agora eu quero fazer uma nova linha após 3 caracteres após meu regex.
por exemplo, obtenho o seguinte resultado:

Intel(USA
)  
Pfizer(USA
)6  
GeneralElectric(USA
)43  
Alphabet(Google)(USA
)

como fazer isso por regex e quais alterações devo aplicar ao meu regex?
Observe que, por algum motivo, devo criar um regex para o mais recente (e não posso usar o mais recente ) e observar que fornece regex para o Notepad ++

Converta arquivos PDF de várias páginas para PNG rapidamente

Detectar apenas caixas mais à esquerda na imagem

Marcar linhas entre dois padrões Regex no Notepad ++ sem incluir os próprios padrões [duplicado]

Como marcar números percentuais normais e decimais no Notepad ++?

Marque linhas consecutivas que tenham o mesmo valor específico

Como marcar linhas antes e depois de uma regex corresponder até uma linha específica?

Como inverter áreas regex no notepad++?

Mantenha apenas o número nas linhas regex

Mover as últimas linhas para a primeira linha

Mesclar as últimas 3 linhas de cada arquivo de texto com uma disposição específica

Marcar linhas consecutivas não vazias que começam e terminam com um regex

Faça uma nova linha após 3 caracteres após regex

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Pubg Mobile's questions