在日常办公、网站运营、网络安全、逆向工程和数字取证领域,准确识别文件类型至关重要。

文件类型识别工具汇总 恶意软件分析

例如:

各大操作系统都通过文件后缀来关联文档缺省打开的应用
论坛/社交媒体对用户上传附件格式检测
网盘对用户上传分享的文件是否违规检测
对用户发送、接收的邮件/消息附件进行病毒检测
由于文件后缀可以任意修改,依靠文件后缀并不能正确识别文件类型,一般不会通过后缀来识别文件类型。经常有人在通过网盘、聊天软件分享文件时候,手工将分享的文件后缀修改,以为就能绕过系统检测,其实毫无意义。

某一种文件类型是有固定特征的,通常由文件存储的二进制格式开头的几个字节(大多数为 2-4 字节)标识,一般称之为 File signature (或者 Magic Number)。要正确识别一个未知文件的类型,需要维护一个文件类型格式数据库,例如 List of file signatures 、GCK’S FILE SIGNATURES TABLE 、filesignatures.net。但这些数据库一般都是由个人维护,受限于维护人员的时间精力,更新不一定及时。

汇总推荐几个常用的文件类型识别工具。

  1. Detect It Easy (DIE):逆向工程界的“瑞士军刀”