AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 102659
Accepted
Prakash Panjwani
Prakash Panjwani
Asked: 2009-12-29 06:18:06 +0800 CST2009-12-29 06:18:06 +0800 CST 2009-12-29 06:18:06 +0800 CST

我如何在 linux 内核上运行 nutch?

  • 772

我想在linux内核上运行nutch,我已经以root用户身份登录,我已经设置了所有的环境变量和nutch文件设置。我创建了一个 url.txt 文件,其中包含要抓取的 url,当我尝试使用以下命令运行 nutch 时,

bin/nutch crawl urls -dir pra

它产生以下异常。

crawl started in: pra
rootUrlDir = urls
threads = 10
depth = 5
Injector: starting
Injector: crawlDb: pra/crawldb
Injector: urlDir: urls
Injector: Converting injected urls to crawl db entries.
Exception in thread "main" java.io.IOException: Failed to get the current user's information.
        at org.apache.hadoop.mapred.JobClient.getUGI(JobClient.java:717)
        at org.apache.hadoop.mapred.JobClient.configureCommandLineOptions(JobClient.java:592)
        at org.apache.hadoop.mapred.JobClient.submitJob(JobClient.java:788)
        at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1142)
        at org.apache.nutch.crawl.Injector.inject(Injector.java:160)
        at org.apache.nutch.crawl.Crawl.main(Crawl.java:113)
Caused by: javax.security.auth.login.LoginException: Login failed: Cannot run program "whoami": java.io.IOException: error=12, Cannot allocate memory
        at org.apache.hadoop.security.UnixUserGroupInformation.login(UnixUserGroupInformation.java:250)
        at org.apache.hadoop.security.UnixUserGroupInformation.login(UnixUserGroupInformation.java:275)
        at org.apache.hadoop.mapred.JobClient.getUGI(JobClient.java:715)
        ... 5 more

服务器有足够的空间来运行任何 java 应用程序。我已经附上了静态数据..

            total       used       free  
Mem:        524320     194632     329688 
-/+ buffers/cache:     194632     329688
Swap:      2475680          0    2475680
Total:     3000000     194632    2805368

nutch的内存空间够吗?请有人帮助我,我是 linux 内核和 nutch 的新手。提前致谢。

linux web-crawler nutch
  • 4 4 个回答
  • 1287 Views

4 个回答

  • Voted
  1. Best Answer
    Aaron Digulla
    2009-12-29T07:05:58+08:002009-12-29T07:05:58+08:00

    读取输出:

    无法运行程序“whoami”:java.io.IOException:错误=12,无法分配内存

    看起来您没有足够的 RAM 或没有交换文件/分区。

    • 2
  2. Ryan Goltry
    2010-01-15T06:41:26+08:002010-01-15T06:41:26+08:00

    在 Java 中调用可执行文件(如 whoami)需要首先制作 Java 进程的完整副本。您需要将最大堆大小 (-Xmx256m) 降低到您可能在 RAM 中同时拥有两个副本的位置。

    • 2
  3. proy
    2010-01-17T01:18:28+08:002010-01-17T01:18:28+08:00

    在操作系统的 32 位安装中,JVM(Java 虚拟机)无法处理大于 4GB 的内存。如果你想使用 JVM 占用 4GB 以上,那么你必须使用 64 位版本的 JVM,这也意味着操作系统也应该是 64 位版本。
    我想这就是您收到该错误的原因。您有 5GB 内存,这可能是问题所在。您应该告诉您的应用程序仅使用 75% 的可用内存或尝试将 RAM 减少到 4GB 并检查。我在使用 Java 作为 Web 界面的 Zimbra 消息传递解决方案中遇到了同样的问题。

    • 1
  4. Zan Lynx
    2010-01-09T22:21:29+08:002010-01-09T22:21:29+08:00

    您的服务器可能已禁用 /proc/sys/vm/overcommit_memory。在没有过度使用的情况下,“fork”系统调用要求您的服务器有足够的 RAM 或交换 Java 进程的完整第二个副本。这可能是很多 RAM。

    • 0

相关问题

  • 多操作系统环境的首选电子邮件客户端

  • 你最喜欢的 Linux 发行版是什么?[关闭]

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve