BinaryTextCast.php 9.1 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231
  1. <?php
  2. namespace App\Casts;
  3. use Illuminate\Contracts\Database\Eloquent\CastsAttributes;
  4. use Illuminate\Support\Facades\DB;
  5. /**
  6. * Каст для двоичных полей MSSQL (VARBINARY).
  7. *
  8. * Чтение: удаляет нулевые байты в конце, пытается дважды декодировать base64,
  9. * затем приводит к UTF-8 и убирает управляющие символы.
  10. * Запись: принимает человекочитаемую строку, при необходимости конвертирует из UTF-8 в CP1251,
  11. * выполняет двойной base64 и сохраняет как HEX-литерал 0x... для совместимости с VARBINARY на MSSQL.
  12. * Пустая строка сохраняется как 0x, NULL — как NULL.
  13. */
  14. class BinaryTextCast implements CastsAttributes
  15. {
  16. /**
  17. * Кэш размеров колонок VARBINARY: ["connection.table.column" => int|null]
  18. */
  19. private static $maxLenCache = [];
  20. /**
  21. * Декодирует значение из двойного base64 и приводит к UTF-8.
  22. */
  23. public function get($model, string $key, $value, array $attributes)
  24. {
  25. $value = $this->stripNulls($value);
  26. if ($value === null || $value === '') {
  27. return $value;
  28. }
  29. $decoded = $value;
  30. for ($i = 0; $i < 2; $i++) {
  31. $tmp = base64_decode($decoded, true);
  32. if ($tmp === false) {
  33. break;
  34. }
  35. $decoded = $this->stripNulls($tmp);
  36. }
  37. return $decoded === null ? null : $this->ensureUtf8($decoded);
  38. }
  39. /**
  40. * Подготавливает строку к сохранению в VARBINARY: CP1251 → двойной base64 → HEX 0x...
  41. */
  42. public function set($model, string $key, $value, array $attributes)
  43. {
  44. $value = $this->stripNulls($value);
  45. if ($value === null) {
  46. return $value; // сохраняем NULL как есть
  47. }
  48. if ($value === '') {
  49. // Пустая бинарная строка для VARBINARY в MSSQL
  50. return DB::raw('0x');
  51. }
  52. // Определяем максимально допустимую длину VARBINARY для данной колонки
  53. $maxLen = $this->getVarbinaryMaxLength($model, $key);
  54. // Готовим "сырой" CP1251 (или то, что пришло в base64) и итоговый двойной base64
  55. $raw = null;
  56. if ($this->isBase64($value)) {
  57. $inner = base64_decode($value, true);
  58. if ($inner !== false && $this->isBase64($inner)) {
  59. // Значение уже двойной base64: пробуем восстановить сырой текст
  60. $raw = base64_decode($inner, true);
  61. $encoded = $value; // пока используем исходный двойной base64
  62. } else {
  63. // Только один слой base64 → сырой текст после одного декодирования
  64. $raw = $inner !== false ? $inner : null;
  65. $encoded = base64_encode($value);
  66. }
  67. }
  68. if ($raw === null) {
  69. // Готовим сырой CP1251 из UTF-8
  70. $prepared = function_exists('iconv') ? @iconv('UTF-8', 'CP1251//IGNORE', $value) : $value;
  71. if ($prepared === false) {
  72. $prepared = $value;
  73. }
  74. $raw = $prepared;
  75. $encoded = base64_encode(base64_encode($prepared));
  76. }
  77. // Если известна максимальная длина и результат не помещается,
  78. // пересчитываем кодирование для усечения по сырой длине так, чтобы двойной base64 гарантированно влез
  79. if (is_int($maxLen) && strlen($encoded) > $maxLen) {
  80. $maxRaw = $this->maxRawLenForDoubleBase64($maxLen);
  81. $raw = substr($raw, 0, max(0, $maxRaw));
  82. $encoded = base64_encode(base64_encode($raw));
  83. }
  84. // MSSQL VARBINARY требует явного бинарного литерала
  85. return DB::raw('0x' . bin2hex($encoded));
  86. }
  87. /**
  88. * Удаляет завершающие нулевые байты (часто встречаются в char(n)).
  89. */
  90. private function stripNulls(?string $value): ?string
  91. {
  92. return $value === null ? null : rtrim($value, "\0");
  93. }
  94. /**
  95. * Лояльная проверка, что строка похожа на base64.
  96. */
  97. private function isBase64(string $value): bool
  98. {
  99. if ($value === '') {
  100. return false;
  101. }
  102. if (preg_match('/^[A-Za-z0-9+\/\r\n]+=*$/', $value) !== 1) {
  103. return false;
  104. }
  105. return (strlen($value) % 4 === 0);
  106. }
  107. /**
  108. * Гарантирует корректный UTF-8, пытаясь конвертацию из CP1251/ISO-8859-1
  109. * и удаляя управляющие символы.
  110. */
  111. private function ensureUtf8(string $value): string
  112. {
  113. if ($value === '') {
  114. return '';
  115. }
  116. if (mb_check_encoding($value, 'UTF-8')) {
  117. return $this->removeControlChars($value);
  118. }
  119. $candidates = [];
  120. if (function_exists('iconv')) {
  121. $candidates[] = fn () => @iconv('CP1251', 'UTF-8//IGNORE', $value);
  122. }
  123. if (function_exists('mb_convert_encoding')) {
  124. $candidates[] = fn () => @mb_convert_encoding($value, 'UTF-8', 'CP1251');
  125. $candidates[] = fn () => @mb_convert_encoding($value, 'UTF-8', 'ISO-8859-1');
  126. }
  127. $candidates[] = fn () => utf8_encode($value);
  128. foreach ($candidates as $candidate) {
  129. $converted = $candidate();
  130. if (is_string($converted) && mb_check_encoding($converted, 'UTF-8')) {
  131. return $this->removeControlChars($converted);
  132. }
  133. }
  134. if (function_exists('iconv')) {
  135. $sanitized = @iconv('UTF-8', 'UTF-8//IGNORE', $value);
  136. if (is_string($sanitized) && mb_check_encoding($sanitized, 'UTF-8')) {
  137. return $this->removeControlChars($sanitized);
  138. }
  139. }
  140. return '';
  141. }
  142. /**
  143. * Удаляет управляющие ASCII-символы (0x00–0x1F, 0x7F).
  144. */
  145. private function removeControlChars(string $value): string
  146. {
  147. $clean = preg_replace('/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F]/u', '', $value);
  148. return is_string($clean) ? $clean : '';
  149. }
  150. /**
  151. * Возвращает максимально допустимую длину VARBINARY для указанной колонки.
  152. * Для varbinary(max) возвращает null (без ограничения).
  153. */
  154. private function getVarbinaryMaxLength($model, string $key): ?int
  155. {
  156. try {
  157. $connection = $model->getConnectionName();
  158. $table = $model->getTable();
  159. $cacheKey = $connection . '.' . $table . '.' . $key;
  160. if (array_key_exists($cacheKey, self::$maxLenCache)) {
  161. return self::$maxLenCache[$cacheKey];
  162. }
  163. $conn = DB::connection($connection);
  164. // Запрашиваем max_length из системных таблиц
  165. $sql = "SELECT c.max_length, t.name AS type_name
  166. FROM sys.columns c
  167. JOIN sys.types t ON c.user_type_id = t.user_type_id
  168. JOIN sys.tables tb ON c.object_id = tb.object_id
  169. WHERE tb.name = ? AND c.name = ?";
  170. $rows = $conn->select($sql, [$table, $key]);
  171. if (!empty($rows)) {
  172. $row = (array) $rows[0];
  173. $type = isset($row['type_name']) ? $row['type_name'] : ($row['type_name'] ?? null);
  174. $max = isset($row['max_length']) ? (int) $row['max_length'] : null;
  175. // Для varbinary(max) max_length = -1
  176. if ($max === -1 && in_array(strtolower((string) $type), ['varbinary', 'binary'], true)) {
  177. self::$maxLenCache[$cacheKey] = null;
  178. return null;
  179. }
  180. self::$maxLenCache[$cacheKey] = $max;
  181. return $max;
  182. }
  183. } catch (\Throwable $e) {
  184. // Игнорируем ошибки определения схемы, работаем без ограничения
  185. }
  186. return null;
  187. }
  188. /**
  189. * Вычисляет максимально допустимую длину "сырого" текста (в байтах),
  190. * чтобы длина двойного base64 не превышала $maxLen.
  191. */
  192. private function maxRawLenForDoubleBase64(int $maxLen): int
  193. {
  194. // Итеративный безопасный расчёт
  195. for ($n = $maxLen; $n >= 0; $n--) {
  196. $b1 = 4 * (int) ceil($n / 3);
  197. $b2 = 4 * (int) ceil($b1 / 3);
  198. if ($b2 <= $maxLen) {
  199. return $n;
  200. }
  201. }
  202. return 0;
  203. }
  204. }