AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 827193
Accepted
Bernmeister
Bernmeister
Asked: 2016-09-20 16:38:24 +0800 CST2016-09-20 16:38:24 +0800 CST 2016-09-20 16:38:24 +0800 CST

检测文本中缺失的字形

  • 772

我编写了一个 Python3 appindicator,它调用fortune并捕获输出以在屏幕通知中显示。

当当前字体中不存在相应的字形时,某些命运包含带有十六进制数字的正方形。每个方块都是丢失字形的十六进制 Unicode 代码点的表示。

我想在向用户显示之前删除十六进制文本。我希望找到一些 Python API,它可以让我逐个字符地检查文本,以确定类似char.isValidCodePoint()或类似的东西,但我找不到这样的东西。

我在这里找到了一个我想研究的可能解决方案,但是通过终端安装后fonttools,我的 Python 程序无法导入fonttools/fontTools.

任何想法 - 使用 Python API 或调用终端?

更新#1:我已经意识到fonttools上面链接中的示例代码对我不起作用,因为它是 Python2。我想如果fonttools可以以某种方式使用,我可以从我的 Python3 脚本中调用 Python2 解释器。

更新#2:经过大量阅读(见下面的参考资料),我发现fc-match但它不能总是唯一地识别正在使用的字体。我在 Python 中获取当前字体:

from gi.repository import Gio
fontName = Gio.Settings( "org.gnome.desktop.interface" ).get_string( "font-name" )

导致Ubuntu 11. 将此结果与十六进制字符一起传递pango-view,我得到一个字体列表,包括Ubuntu. 在我看来,如果字形不是由字体呈现的,那么字体不应该出现在pango-view!

参考:

  • 如何找出 fc-match 是如何匹配的?
  • 找出 fontconfig 为某个字符使用的后备字体
  • 我盯着字体配置,字体配置又盯着我
python
  • 3 3 个回答
  • 2146 Views

3 个回答

  • Voted
  1. Christopher Hunter
    2017-11-11T10:03:27+08:002017-11-11T10:03:27+08:00

    这是与您使用此方法不同的方法,但也许您可以使用 pythonstr.replace()或re.sub()方法从文本正文中解析出十六进制字符串。IE:

    如果十六进制是可预测的:

    originalText = "\xc3\xa5Test"
    filteredText = originalText.replace("\xc3\xa5", "")
    

    或者,如果您需要使用正则表达式匹配任何十六进制字符:

    import re
    
    originalText = "\xc3\xa5Test"
    filteredText = re.sub(r'[^\x00-\x7f]', r'', originalText)
    

    更多关于这个策略的讨论

    • 0
  2. user.dz
    2019-11-05T12:01:07+08:002019-11-05T12:01:07+08:00

    Unicode 整形引擎

    使用像 Harfbuzz 这样的 Unicode 整形引擎来检测丢失的字形。这是一个工作示例:

    from pyharfbuzz import shape
    f = "/usr/local/lib/python3.6/site-packages/werkzeug/debug/shared/ubuntu.ttf"
    t = "®"
    s = shape(f, t)
    print(s[1]['glyph_name'])
    t = "რ"
    s = shape(f, t)
    print(s[1]['glyph_name'])
    

    输出

    registered
    .notdef
    

    检查时 IDLE3 中的输出如下:

    >>> t = "®"
    >>> s = shape(f, t)
    >>> s
    [{'cluster': 0, 'glyph_name': 'registered', 'x_advance': 29.453125, 'y_advance': 0.0, 'x_offset': 0.0, 'y_offset': 0.0}]
    >>> t = "რ"
    >>> s = shape(f, t)
    >>> s
    [{'cluster': 0, 'glyph_name': '.notdef', 'x_advance': 36.0, 'y_advance': 0.0, 'x_offset': 0.0, 'y_offset': 0.0}]
    

    检查正确的字体路径,我刚刚选择了我在当前机器上看到的第一个。

    笔记:

    • 我很确定 Gtk/Pango 有类似的功能,Pango 已经切换到低级别使用 Harfbuzz。但是,我没有使用此类库的经验。
    • 0
  3. Best Answer
    Bernmeister
    2020-09-12T21:03:06+08:002020-09-12T21:03:06+08:00

    已经想出了一个解决方案...最初我认为财富文本文件不包含十六进制字符。事实证明这是不正确的。因此,一旦我意识到这一点,我就想出了以下解决方案:

    import codecs
    fortune = <call the fortune program>
    output = ""
    for c in fortune:
        if codecs.encode( str.encode( c ), "hex" ) == b'07':
            continue
    
        output += c                   
    
    print( output )
    
    • 0

相关问题

  • 默认的字符编码是什么?

  • 如何使用 pynotify 创建可点击通知?

  • 有没有安装 Django 1.2.*(最新稳定版)的简单方法?

  • 为 Python 应用程序设置构建系统

  • 为我的 PPA 创建包时遇到问题

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve