欢迎访问翻译网!

翻译网

您现在的位置是: 首页 > 笔译 >详情

pdf 文件 翻译(pdf的翻译功能在哪里)

发布时间:2024-01-07 20:56:52 笔译 74次 作者:翻译网

作者:赫克托卡拉比亚

对于许多译者来说,Acrobat 便携式文档格式文件是噩梦般的;更重要的是,在论坛和邮件列表中,这个问题会定期再次出现: 如何编辑此PDF 文档?

pdf 文件 翻译(pdf的翻译功能在哪里)

简短回答: 你不能。

长回答: 这是可能的,但效果有限,而且很可能您的客户对结果不满意。

关键是PDF 文档从来就不是用来编辑或翻译的。大约十年前,其创建者Adobe Inc. 成功地满足了市场需求: 个文档可以轻松交换、打印和查看,但不能在所有类型的计算机上进行修改。也就是说,计算机相当于一份打印文档。这正是Acrobat 文档的本质。

它们必须被视为印刷文档,而不是可编辑文档。该格式非常成功,以至于有源源不断的PDF 文档需要翻译。然而,由于大多数计算机格式都是可编辑的,因此存在一个问题:尽管其创建者的初衷是这样的,但人们无法相信PDF是不可编辑的,因此他们要求对这些文档进行翻译和修改。

处理PDF 文档

许多翻译人员已经知道答案: 您无法在PDF 上提供翻译,至少在您已交付的同一个PDF 上是这样。该格式不可(广泛)编辑。

您可以尝试从PDF 中提取文本并使用您最喜欢的文字处理程序对其进行处理。最直接、最经济的过程只需按Acrobat Reader 中的“选择文本”按钮,然后按Ctrl-A(全选),然后将内容复制到剪贴板(Ctrl-V)。然后您可以将其粘贴到文字处理器中。

根据页面布局的复杂性,这可能无法令人满意。虽然我已经有一段时间没有使用这个过程了,但我刚刚将PDF 复制粘贴到Word 中,结果是可用的,在紧要关头,保留了: 种字体和字体大小,表格消失了,尽管它们的内容被保留了(在某种程度上)损坏的形式),插图消失了。主要问题是每行以硬回车/换行结束,通常必须用单个空格替换才能再次具有连续的句子。我开发了一个小型Word 宏,用于搜索回车符并用空格替换它们。然而,这必须在人工监督下一次一行地完成,因为系统无法知道何时应保留回车符(例如,在标题、列表和段落末尾)。

自动转换

在许多情况下,自动转换程序是更好的选择。我使用过纯PDF 到Word 转换器(Scansoft PDF Converter)和光学字符识别软件(Omnipage 和Fine Reader)。您可以通过在Internet 上搜索PDF 提取或PDF 转换来找到这两种类型的完整提供。

它们之间有什么区别?

我已经说过PDF 就像印刷文档。然而,在大多数情况下,文本保留为计算机字符,也就是说,您可以复制/粘贴它。在其他一些情况下,所有文本(或其中的一些文本,例如标题中的文本)只是图像,就像传真页面上的字符一样。纯PDF 转换器可以处理计算机字符,但它们在处理图形时会令人窒息。如果文档包含全部或部分图形字符区域,则它们无法处理它们。在这种情况下,光学字符识别程序就派上用场了。他们将页面视为真正的打印页面,并尝试解释它并将其转换为计算机字符。他们还可能提取页面上的插图。无需为此打印和扫描Acrobat 页面。现代OCR 软件直接接受它们。

PDF 也可以受密码保护。如果您没有密码,则无法从中提取文本。除非提供密码,否则字符转换器无法处理这些文件。 OCR 转换器可以完美地处理它们,因为它们只查看页面,而不使用其内部字符编码。