我在一家印刷厂工作,那里有大量的旧印刷工作档案。目前,要找到一份工作,我们必须搜索 SMB 共享(在 win2000 服务器上),它会查看几十万个文件。
我们的工作数据按以下方式组织:年>月>客户_姓名_工作# 然后工作的内容在最后一个文件夹中。
有没有办法创建一个数据库,以便我们可以查询工作描述。或工号?基本上只是一个比使用 Windows 搜索更快的简单搜索就很好了。我尝试了 Windows 索引服务,但它只能找到 .doc 文件,不能找到文件夹名称或 PDF。
将来我们计划制作一个 SQL 数据库,在创建作业时将输入完整信息,以便将来轻松查询。我希望把一些东西放在一起,这样可以更容易地搜索旧订单。
您可以为此使用面向文档的数据库。然后,您可以用您喜欢的语言创建一个程序,将现有文档导入数据库,解析元数据(客户、工作#等)的文件夹结构。
我个人不会尝试为此从头开始设计数据库——您在图书馆和档案馆领域寻找的东西将被称为“数字存储库”(从“数字图书馆”中抽象出来的一个步骤,通常只跟踪书目项目)。在商业世界中,他们谈论诸如数字资产管理之类的东西,但有时这是通过注册表而不是存储库完成的;不同的是,在注册表中,您只跟踪有关对象的信息,但它只指向对象,而不是存储对象的权威副本。
看看这些项目中的一个是否可以适应您的需求:
或者,查看更大的免费和开源数字存储库软件列表