其中一个应用程序要求是数据文件必须是人类可读的纯文本,这意味着该文件可以导入Excel或由记事本打开.我正在使用像CSV一样的可变长度记录格式,我已经使用C标准库文件I / O函数成功实现了.
保存记录时,我必须计算更新的记录是大于还是小于数据文件中当前记录的版本.如果更大,我首先将当前记录之后的所有记录立即转移所计算的大小差异,然后再保存更新的记录.操作系统自动扩展EOF以容纳额外数据.如果更小,我将所有记录向后移动我计算的偏移量.这很好用,但我发现无法修改EOF标记或文件大小以忽略最后一条记录结束后的数据.
大多数时间记录的大小会增加,因为数据收集程序将在保存记录时用数据填充一些空字段.记录只会在对现有条目进行更正时缩小,或者在正常记录上进行缩减,如果记录中的描述性数据长于程序在内存中读取的数据.
在收缩记录的情况下,在文件中的最后一条记录之后,我留下了在转移之前坐在那里的任何数据.在“缩小记录保存”之后,我一直在向文件中写入EOF分隔符,以指示记录结束的位置并填充剩余数据,但是在“增长记录保存”之前我不再有一个干净的文件在空间填充区域上扩展文件的大小. unistd.h中的truncate()函数不起作用(我现在认为这只适用于* nix风格?).
我见过的一个提出的解决方案涉及创建第二个文件并将要保存的所有数据写入该文件,然后删除原始文件.由于我只有4MB的磁盘空间可供使用,如果文件大小小于2MB减去程序可执行文件和配置文件的大小,则可以使用,但否则会失败.当它投入生产时,用户最终可能会得到一个超过2MB的文件.
我已经看过Ralph Brown’s Interrupt List和IBM PC Assembly Language and Programming中的中断参考,我似乎找不到任何更新文件大小或类似的东西.