vendor/symfony/string/UnicodeString.php line 33

Open in your IDE?
  1. <?php
  2. /*
  3.  * This file is part of the Symfony package.
  4.  *
  5.  * (c) Fabien Potencier <fabien@symfony.com>
  6.  *
  7.  * For the full copyright and license information, please view the LICENSE
  8.  * file that was distributed with this source code.
  9.  */
  10. namespace Symfony\Component\String;
  11. use Symfony\Component\String\Exception\ExceptionInterface;
  12. use Symfony\Component\String\Exception\InvalidArgumentException;
  13. /**
  14.  * Represents a string of Unicode grapheme clusters encoded as UTF-8.
  15.  *
  16.  * A letter followed by combining characters (accents typically) form what Unicode defines
  17.  * as a grapheme cluster: a character as humans mean it in written texts. This class knows
  18.  * about the concept and won't split a letter apart from its combining accents. It also
  19.  * ensures all string comparisons happen on their canonically-composed representation,
  20.  * ignoring e.g. the order in which accents are listed when a letter has many of them.
  21.  *
  22.  * @see https://unicode.org/reports/tr15/
  23.  *
  24.  * @author Nicolas Grekas <p@tchwork.com>
  25.  * @author Hugo Hamon <hugohamon@neuf.fr>
  26.  *
  27.  * @throws ExceptionInterface
  28.  */
  29. class UnicodeString extends AbstractUnicodeString
  30. {
  31.     public function __construct(string $string '')
  32.     {
  33.         $this->string normalizer_is_normalized($string) ? $string normalizer_normalize($string);
  34.         if (false === $this->string) {
  35.             throw new InvalidArgumentException('Invalid UTF-8 string.');
  36.         }
  37.     }
  38.     public function append(string ...$suffix): AbstractString
  39.     {
  40.         $str = clone $this;
  41.         $str->string $this->string.(>= \count($suffix) ? ($suffix[0] ?? '') : implode(''$suffix));
  42.         normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  43.         if (false === $str->string) {
  44.             throw new InvalidArgumentException('Invalid UTF-8 string.');
  45.         }
  46.         return $str;
  47.     }
  48.     public function chunk(int $length 1): array
  49.     {
  50.         if ($length) {
  51.             throw new InvalidArgumentException('The chunk length must be greater than zero.');
  52.         }
  53.         if ('' === $this->string) {
  54.             return [];
  55.         }
  56.         $rx '/(';
  57.         while (65535 $length) {
  58.             $rx .= '\X{65535}';
  59.             $length -= 65535;
  60.         }
  61.         $rx .= '\X{'.$length.'})/u';
  62.         $str = clone $this;
  63.         $chunks = [];
  64.         foreach (preg_split($rx$this->string, -1\PREG_SPLIT_DELIM_CAPTURE \PREG_SPLIT_NO_EMPTY) as $chunk) {
  65.             $str->string $chunk;
  66.             $chunks[] = clone $str;
  67.         }
  68.         return $chunks;
  69.     }
  70.     public function endsWith($suffix): bool
  71.     {
  72.         if ($suffix instanceof AbstractString) {
  73.             $suffix $suffix->string;
  74.         } elseif (\is_array($suffix) || $suffix instanceof \Traversable) {
  75.             return parent::endsWith($suffix);
  76.         } else {
  77.             $suffix = (string) $suffix;
  78.         }
  79.         $form null === $this->ignoreCase \Normalizer::NFD \Normalizer::NFC;
  80.         normalizer_is_normalized($suffix$form) ?: $suffix normalizer_normalize($suffix$form);
  81.         if ('' === $suffix || false === $suffix) {
  82.             return false;
  83.         }
  84.         if ($this->ignoreCase) {
  85.             return === mb_stripos(grapheme_extract($this->string\strlen($suffix), \GRAPHEME_EXTR_MAXBYTES\strlen($this->string) - \strlen($suffix)), $suffix0'UTF-8');
  86.         }
  87.         return $suffix === grapheme_extract($this->string\strlen($suffix), \GRAPHEME_EXTR_MAXBYTES\strlen($this->string) - \strlen($suffix));
  88.     }
  89.     public function equalsTo($string): bool
  90.     {
  91.         if ($string instanceof AbstractString) {
  92.             $string $string->string;
  93.         } elseif (\is_array($string) || $string instanceof \Traversable) {
  94.             return parent::equalsTo($string);
  95.         } else {
  96.             $string = (string) $string;
  97.         }
  98.         $form null === $this->ignoreCase \Normalizer::NFD \Normalizer::NFC;
  99.         normalizer_is_normalized($string$form) ?: $string normalizer_normalize($string$form);
  100.         if ('' !== $string && false !== $string && $this->ignoreCase) {
  101.             return \strlen($string) === \strlen($this->string) && === mb_stripos($this->string$string0'UTF-8');
  102.         }
  103.         return $string === $this->string;
  104.     }
  105.     public function indexOf($needleint $offset 0): ?int
  106.     {
  107.         if ($needle instanceof AbstractString) {
  108.             $needle $needle->string;
  109.         } elseif (\is_array($needle) || $needle instanceof \Traversable) {
  110.             return parent::indexOf($needle$offset);
  111.         } else {
  112.             $needle = (string) $needle;
  113.         }
  114.         $form null === $this->ignoreCase \Normalizer::NFD \Normalizer::NFC;
  115.         normalizer_is_normalized($needle$form) ?: $needle normalizer_normalize($needle$form);
  116.         if ('' === $needle || false === $needle) {
  117.             return null;
  118.         }
  119.         try {
  120.             $i $this->ignoreCase grapheme_stripos($this->string$needle$offset) : grapheme_strpos($this->string$needle$offset);
  121.         } catch (\ValueError $e) {
  122.             return null;
  123.         }
  124.         return false === $i null $i;
  125.     }
  126.     public function indexOfLast($needleint $offset 0): ?int
  127.     {
  128.         if ($needle instanceof AbstractString) {
  129.             $needle $needle->string;
  130.         } elseif (\is_array($needle) || $needle instanceof \Traversable) {
  131.             return parent::indexOfLast($needle$offset);
  132.         } else {
  133.             $needle = (string) $needle;
  134.         }
  135.         $form null === $this->ignoreCase \Normalizer::NFD \Normalizer::NFC;
  136.         normalizer_is_normalized($needle$form) ?: $needle normalizer_normalize($needle$form);
  137.         if ('' === $needle || false === $needle) {
  138.             return null;
  139.         }
  140.         $string $this->string;
  141.         if ($offset) {
  142.             // workaround https://bugs.php.net/74264
  143.             if ($offset += grapheme_strlen($needle)) {
  144.                 $string grapheme_substr($string0$offset);
  145.             }
  146.             $offset 0;
  147.         }
  148.         $i $this->ignoreCase grapheme_strripos($string$needle$offset) : grapheme_strrpos($string$needle$offset);
  149.         return false === $i null $i;
  150.     }
  151.     public function join(array $strings, ?string $lastGlue null): AbstractString
  152.     {
  153.         $str parent::join($strings$lastGlue);
  154.         normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  155.         return $str;
  156.     }
  157.     public function length(): int
  158.     {
  159.         return grapheme_strlen($this->string);
  160.     }
  161.     /**
  162.      * @return static
  163.      */
  164.     public function normalize(int $form self::NFC): parent
  165.     {
  166.         $str = clone $this;
  167.         if (\in_array($form, [self::NFCself::NFKC], true)) {
  168.             normalizer_is_normalized($str->string$form) ?: $str->string normalizer_normalize($str->string$form);
  169.         } elseif (!\in_array($form, [self::NFDself::NFKD], true)) {
  170.             throw new InvalidArgumentException('Unsupported normalization form.');
  171.         } elseif (!normalizer_is_normalized($str->string$form)) {
  172.             $str->string normalizer_normalize($str->string$form);
  173.             $str->ignoreCase null;
  174.         }
  175.         return $str;
  176.     }
  177.     public function prepend(string ...$prefix): AbstractString
  178.     {
  179.         $str = clone $this;
  180.         $str->string = (>= \count($prefix) ? ($prefix[0] ?? '') : implode(''$prefix)).$this->string;
  181.         normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  182.         if (false === $str->string) {
  183.             throw new InvalidArgumentException('Invalid UTF-8 string.');
  184.         }
  185.         return $str;
  186.     }
  187.     public function replace(string $fromstring $to): AbstractString
  188.     {
  189.         $str = clone $this;
  190.         normalizer_is_normalized($from) ?: $from normalizer_normalize($from);
  191.         if ('' !== $from && false !== $from) {
  192.             $tail $str->string;
  193.             $result '';
  194.             $indexOf $this->ignoreCase 'grapheme_stripos' 'grapheme_strpos';
  195.             while ('' !== $tail && false !== $i $indexOf($tail$from)) {
  196.                 $slice grapheme_substr($tail0$i);
  197.                 $result .= $slice.$to;
  198.                 $tail substr($tail\strlen($slice) + \strlen($from));
  199.             }
  200.             $str->string $result.$tail;
  201.             normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  202.             if (false === $str->string) {
  203.                 throw new InvalidArgumentException('Invalid UTF-8 string.');
  204.             }
  205.         }
  206.         return $str;
  207.     }
  208.     public function replaceMatches(string $fromRegexp$to): AbstractString
  209.     {
  210.         $str parent::replaceMatches($fromRegexp$to);
  211.         normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  212.         return $str;
  213.     }
  214.     public function slice(int $start 0, ?int $length null): AbstractString
  215.     {
  216.         $str = clone $this;
  217.         if (\PHP_VERSION_ID 80000 && $start && grapheme_strlen($this->string) < -$start) {
  218.             $start 0;
  219.         }
  220.         $str->string = (string) grapheme_substr($this->string$start$length ?? 2147483647);
  221.         return $str;
  222.     }
  223.     public function splice(string $replacementint $start 0, ?int $length null): AbstractString
  224.     {
  225.         $str = clone $this;
  226.         if (\PHP_VERSION_ID 80000 && $start && grapheme_strlen($this->string) < -$start) {
  227.             $start 0;
  228.         }
  229.         $start $start \strlen(grapheme_substr($this->string0$start)) : 0;
  230.         $length $length \strlen(grapheme_substr($this->string$start$length ?? 2147483647)) : $length;
  231.         $str->string substr_replace($this->string$replacement$start$length ?? 2147483647);
  232.         normalizer_is_normalized($str->string) ?: $str->string normalizer_normalize($str->string);
  233.         if (false === $str->string) {
  234.             throw new InvalidArgumentException('Invalid UTF-8 string.');
  235.         }
  236.         return $str;
  237.     }
  238.     public function split(string $delimiter, ?int $limit null, ?int $flags null): array
  239.     {
  240.         if ($limit $limit ?? 2147483647) {
  241.             throw new InvalidArgumentException('Split limit must be a positive integer.');
  242.         }
  243.         if ('' === $delimiter) {
  244.             throw new InvalidArgumentException('Split delimiter is empty.');
  245.         }
  246.         if (null !== $flags) {
  247.             return parent::split($delimiter.'u'$limit$flags);
  248.         }
  249.         normalizer_is_normalized($delimiter) ?: $delimiter normalizer_normalize($delimiter);
  250.         if (false === $delimiter) {
  251.             throw new InvalidArgumentException('Split delimiter is not a valid UTF-8 string.');
  252.         }
  253.         $str = clone $this;
  254.         $tail $this->string;
  255.         $chunks = [];
  256.         $indexOf $this->ignoreCase 'grapheme_stripos' 'grapheme_strpos';
  257.         while ($limit && false !== $i $indexOf($tail$delimiter)) {
  258.             $str->string grapheme_substr($tail0$i);
  259.             $chunks[] = clone $str;
  260.             $tail substr($tail\strlen($str->string) + \strlen($delimiter));
  261.             --$limit;
  262.         }
  263.         $str->string $tail;
  264.         $chunks[] = clone $str;
  265.         return $chunks;
  266.     }
  267.     public function startsWith($prefix): bool
  268.     {
  269.         if ($prefix instanceof AbstractString) {
  270.             $prefix $prefix->string;
  271.         } elseif (\is_array($prefix) || $prefix instanceof \Traversable) {
  272.             return parent::startsWith($prefix);
  273.         } else {
  274.             $prefix = (string) $prefix;
  275.         }
  276.         $form null === $this->ignoreCase \Normalizer::NFD \Normalizer::NFC;
  277.         normalizer_is_normalized($prefix$form) ?: $prefix normalizer_normalize($prefix$form);
  278.         if ('' === $prefix || false === $prefix) {
  279.             return false;
  280.         }
  281.         if ($this->ignoreCase) {
  282.             return === mb_stripos(grapheme_extract($this->string\strlen($prefix), \GRAPHEME_EXTR_MAXBYTES), $prefix0'UTF-8');
  283.         }
  284.         return $prefix === grapheme_extract($this->string\strlen($prefix), \GRAPHEME_EXTR_MAXBYTES);
  285.     }
  286.     public function __wakeup()
  287.     {
  288.         if (!\is_string($this->string)) {
  289.             throw new \BadMethodCallException('Cannot unserialize '.__CLASS__);
  290.         }
  291.         normalizer_is_normalized($this->string) ?: $this->string normalizer_normalize($this->string);
  292.     }
  293.     public function __clone()
  294.     {
  295.         if (null === $this->ignoreCase) {
  296.             normalizer_is_normalized($this->string) ?: $this->string normalizer_normalize($this->string);
  297.         }
  298.         $this->ignoreCase false;
  299.     }
  300. }