微信小程序通过二进制数据检查文件的“魔术数字”(magic number)来确定文件类型

在JavaScript中,可以通过读取文件的二进制数据并检查文件的 “魔术数字”(magic number) 来确定文件类型。魔术数字是指文件开始部分的一组特定的字节序列,不同的文件类型会有不同的魔术数字。

JavaScript中实现

以下是一个简单的示例,展示如何使用FileReader API来读取文件的二进制数据,并基于前几个字节来判断文件类型:

function detectFileType() {
    const input = document.getElementById('fileInput');
    const file = input.files[0];

    if (!file) {
        console.log('No file selected.');
        return;
    }

    const reader = new FileReader();

    reader.onloadend = function() {
        const arrayBuffer = reader.result;
        const byteArray = new Uint8Array(arrayBuffer);

        // 检查文件类型
        const fileType = getFileType(byteArray);
        document.getElementById('result').innerText = `Detected file type: ${fileType}`;
    };

    reader.readAsArrayBuffer(file);
}

function getFileType(byteArray) {
    // 文件类型及其对应的魔术数字,下面这些魔术数字不保证准确
    const fileTypes = [
        { signature: [0xFF, 0xD8, 0xFF], type: 'JPEG' },
        { signature: [0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A], type: 'PNG' },
        { signature: [0x47, 0x49, 0x46, 0x38], type: 'GIF' },
        { signature: [0x52, 0x49, 0x46, 0x46], type: 'WEBP' },
        { signature: [0x42, 0x4D], type: 'BMP' },
    ];

    for (const type of fileTypes) {
        let match = true;
        for (let i = 0; i < type.signature.length; i++) {
            if (byteArray[i] !== type.signature[i]) {
                match = false;
                break;
            }
        }
        if (match) {
            return type.type;
        }
    }

    return 'Unknown';
}

微信小程序中实现

那么如何在微信小程序里面如何实现类似的功能。

  • 期初以为小程序里面是不能实现的,因为不知道Uint8Array在小程序里面有没有,经过验证有这个函数。
  • 在小程序中使用fs.readFileSync(filePath)可以获得文件的ArrayBuffer,这样就能完美解决问题
    • filePath必须是小程序本地地址才行,不能使用网络地址
    • const fs = uni.getFileSystemManager()

完整代码

// pages/index/index.js
Page({
  data: {
    fileType: ''
  },

  chooseFile: function() {
    wx.chooseMessageFile({
      count: 1,
      success: (res) => {
        this.readFile(res.tempFiles[0].path);
      }
    });
  },

  readFile: function(filePath) {
    const fs = wx.getFileSystemManager();
    fs.readFile({
      filePath: filePath,
      encoding: 'binary', // 注意这里使用 'binary' 模式读取文件
      success: (res) => {
        const buffer = res.data;
        const fileType = this.detectFileType(buffer);
        this.setData({
          fileType: fileType
        });
      },
      fail: (err) => {
        console.error('Failed to read file:', err);
      }
    });
  },

  detectFileType: function(buffer) {
    // 文件类型及其对应的魔术数字,下面这些魔术数字不保证准确
    const fileTypes = [
      { signature: [0xFF, 0xD8, 0xFF], type: 'JPEG' },
      { signature: [0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A], type: 'PNG' },
      { signature: [0x47, 0x49, 0x46, 0x38], type: 'GIF' },
      { signature: [0x52, 0x49, 0x46, 0x46], type: 'WEBP' },
      { signature: [0x42, 0x4D], type: 'BMP' },
    ];

    const header = new Uint8Array(buffer.slice(0, 8)); // 取出前8个字节作为头部

    for (const type of fileTypes) {
      let match = true;
      for (let i = 0; i < type.signature.length; i++) {
        if (header[i] !== type.signature[i]) {
          match = false;
          break;
        }
      }
      if (match) {
        return type.type;
      }
    }

    return 'Unknown';
  }
});

注意

取出前12个字节作为头部

对于MP4格式的文件,其魔术数字(signature)通常以 ftyp 原子开始,后面跟着 isom 字符串。

这里的 ftyp 是一个原子(box),它定义了文件的兼容性品牌和版本。isom 表示该文件遵循 ISO 基础媒体文件格式(ISO Base Media File Format),这是 MP4 格式的标准基础。

const header = new Uint8Array(buffer.slice(0, 12));

相对准确一点的魔术数字

下面是相对全面和准确的魔术数字,及相关代码

const fs = uni.getFileSystemManager()
const logger = log()

const imageFileTypes = [
  { signature: [0xFF, 0xD8, 0xFF], type: 'JPEG' },
  { signature: [0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A], type: 'PNG' },
  { signature: [0x47, 0x49, 0x46, 0x38], type: 'GIF' },
  { signature: [0x52, 0x49, 0x46, 0x46], type: 'WEBP' },
  { signature: [0x42, 0x4D], type: 'BMP' },
  { signature: [0x50, 0x33, 0x20, 0x23], type: 'PPM' }, // Portable Pixmap Format
  { signature: [0x50, 0x62, 0x20, 0x23], type: 'PGM' }, // Portable Graymap Format
  { signature: [0x50, 0x70, 0x20, 0x23], type: 'PPM' }, // Portable PixMap Format
  { signature: [0x50, 0x6D, 0x20, 0x23], type: 'PGM' }, // Portable GrayMap Format
  { signature: [0x50, 0x70, 0x20, 0x23], type: 'PBM' }, // Portable BitMap Format
  { signature: [0x50, 0x6D, 0x20, 0x23], type: 'PBM' }, // Portable BitMap Format
  { signature: [0x00, 0x00, 0x01, 0x00], type: 'ICO' },
]

const videoFileTypes = [
  { signature: [0x00, 0x00, 0x00, 0x18, 0x66, 0x74, 0x79, 0x70, 0x69, 0x73, 0x6F, 0x6D], type: 'MP4' },
  { signature: [0x00, 0x00, 0x00, 0x20, 0x66, 0x74, 0x79, 0x70, 0x69, 0x73, 0x6F, 0x6D], type: 'MP4' },
  { signature: [0x00, 0x00, 0x00, 0x1C, 0x66, 0x74, 0x79, 0x70, 0x69, 0x73, 0x6F, 0x6D], type: 'MP4' },
  { signature: [0x00, 0x00, 0x00, 0x20, 0x66, 0x74, 0x79, 0x70, 0x6D, 0x70, 0x34, 0x32], type: 'MP4' },
  { signature: [0x00, 0x00, 0x00, 0x1C, 0x66, 0x74, 0x79, 0x70, 0x6D, 0x70, 0x34, 0x32], type: 'MP4' },
  { signature: [0x52, 0x49, 0x46, 0x46], type: 'AVI' },
  { signature: [0x00, 0x00, 0x01, 0xBA], type: 'MPEG-1' },
  { signature: [0x00, 0x00, 0x01, 0xB3], type: 'MPEG-2' },
  { signature: [0x00, 0x00, 0x00, 0x18, 0x66, 0x74, 0x79, 0x70], type: 'MOV' },
  { signature: [0x46, 0x4C, 0x56, 0x01], type: 'FLV' },
  { signature: [0x1A, 0x45, 0xDF, 0xA3], type: 'MKV/WebM' },
  { signature: [0x30, 0x26, 0xB2, 0x75], type: 'WMV' },
  { signature: [0x4F, 0x67, 0x67, 0x53], type: 'OGG' },
  { signature: [0x47], type: 'TS' },
  { signature: [0x00, 0x00, 0x00, 0x14, 0x66, 0x74, 0x79, 0x70], type: '3GP' },
  { signature: [0x2E, 0x52, 0x4D, 0x46], type: 'RMVB' },
]

const oherFileTypes = [
  { signature: [0x50, 0x4B, 0x03, 0x04], type: 'ZIP' },
  { signature: [0x52, 0x61, 0x72, 0x21, 0x1A, 0x07, 0x00], type: 'RAR' },
  { signature: [0x37, 0x7A, 0xBC, 0xAF], type: '7-Zip' },
  { signature: [0x25, 0x50, 0x44, 0x46], type: 'PDF' },
  { signature: [0x50, 0x4B, 0x03, 0x04, 0x31, 0x57, 0x52, 0x64], type: 'DOCX' },
  { signature: [0x50, 0x4B, 0x03, 0x04, 0x58, 0x53, 0x06, 0x00], type: 'XLSX' },
  { signature: [0x50, 0x4B, 0x03, 0x04, 0x50, 0x50, 0x54, 0x06], type: 'PPTX' },
]

const imageTypes = imageFileTypes.map(item => item.type)
const videoTypes = videoFileTypes.map(item => item.type)
const oherTypes = oherFileTypes.map(item => item.type)

一些简单用法

// 获取对应类型
const getType = (header: Uint8Array) => {
  const types = [...imageFileTypes, ...videoFileTypes, ...oherFileTypes]
  for (const type of types) {
    let match = true;
    for (let i = 0; i < type.signature.length; i++) {
      if (header[i] !== type.signature[i]) {
        match = false;
        break;
      }
    }
    if (match) {
      return type.type;
    }
  }

// 获取权限并建议格式是否正确
const detectFileType = async (tempFilePath: string, judgeType: 'image' | 'video'): Promise<string> => {
  const arraybuffer = fs.readFileSync(tempFilePath) as ArrayBuffer

  if (Object.prototype.toString.call(arraybuffer) !== '[object ArrayBuffer]') return 'Unknown'

  const header = new Uint8Array(arraybuffer.slice(0, 12)); // 取出前12个字节作为头部

  console.log(`文件头部`, header.toString(), '16进制', [...header].map(item => item.toString(16)).toString())

  const type = getType(header)

  switch(judgeType) {
    case 'image':
      if (!imageTypes.includes(type)) {
        uni.showToast({
          icon: 'none',
          title: `~~当前文件真实类型可能是${type}~~,请确认是否为图片文件~~`
        })

        return new Promise((resolve) => {

          setTimeout(() =>{
            resolve(type)
          }, 2500)

        })
      }
      break

    case 'video':

      if (!videoTypes.includes(type)) {
        uni.showToast({
          icon: 'none',
          title: `~~当前文件真实类型可能是${type}~~,请确认是否为视频文件~~`
        })

        return new Promise((resolve) => {

          setTimeout(() =>{
            resolve(type)
          }, 2500)

        })
      }
      break

    default:
  }

  return type
}

  return 'Unknown'
}

export default detectFileType
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349

推荐阅读更多精彩内容