38 research outputs found

    A Modified Approach to the Mathematical Model of Crack with Pre-destruction Zones

    Get PDF
    Generalized Griffith’s criterion and models with pre-destruction zones are considered in this paper. Unlike those models that used linear dependences, the authors proposed the destruction process to be represented by differential equations. The positive effect of such representation is the possibility to formulate boundary conditions using the corresponding constant in the differential equation solution. The result is that the critical load values responsible for the occurrence and propagation of quasi-brittle cracks in materials are obtained. It is stated that the maximum load of crack propagation completely or essentially depends on its initial length. These generalizations estimate the influence of stress caused by hydrogen close to crack-like defects. In the case of defect-free material, the established formula is used to determine the critical forces necessary for the occurrence of cracks with a definite length. Numerical examples for some types of materials are given to illustrate the theoretical estimates

    Розвинення асимптотичних підходів при дослідженні поздовжніх та крутильних коливань балки, яка рухається

    Get PDF
    This paper analyzes the influence of kinetic and physical-mechanical parameters of systems on the characteristics of dynamic processes in moving one-dimensional nonlinear-elastic systems. Improved convenient calculation formulas have been derived that describe the laws of changing the amplitude-frequency characteristics of systems for both a non-resonant case and a resonant one. An important issue of studying the influence of the speed of movement of elements of mechanisms on the oscillations of one-dimensional nonlinear-elastic systems has not been considered in detail until now in the scientific literature. This issue relates to the vibrations of shafts in gears, pipe strings when drilling oil and gas wells, the oscillations of turbine blades and rotating turbine discs, the longitudinal vibrations of the beam as an element of structures. The main reason for this in the analytical study of dynamic processes were the shortcomings of the mathematical apparatus for solving the corresponding nonlinear differential equations that describe the laws of motion of those systems. It was found that in the case of longitudinal oscillations in the moving beam with an increase in the longitudinal speed of the medium to 10 m/s, the amplitude of the oscillation also increases by 13.5 %. However, when the longitudinal velocity of the beam is 5 m/s, the amplitude will increase by only 3 %. It is established that with the growth of the amplitude, the frequency of longitudinal oscillations decreases sharply, and if the system moves at a higher speed, for example, 20 m/s, it reduces the frequency of oscillation by about 13 %. The results reported here make it possible to assess the effect of kinetic and physical-mechanical parameters on the frequency and amplitude of oscillations. The research that involved the asymptotic method makes it possible to predict resonant phenomena and obtain engineering solutions to improve the efficiency of technological equipment.Проведено аналіз впливу кінетичних та фізико-механічних параметрів систем на характеристики динамічних процесів рухомих одновимірних нелінійно-пружних систем. Отримано зручні удосконалені розрахункові формули, які описують закони зміни амплітудно-частотних характеристик систем як для нерезонансного випадку, так й резонансного. Важлива проблема вивчення впливу швидкості руху елементів механізмів на коливання одновимірних нелінійно-пружних систем у достатній мірі дотепер в науковій літературі не розглядалася. Вказана проблема стосується коливань валів у зубчастих передачах, колон труб при бурінні нафтових і газових свердловин, коливань турбінних лопаток і турбінних дисків, що обертаються, поздовжніх коливань балки, як елемента конструкцій. Основною причиною цього при аналітичному дослідженні динамічних процесів були недоліки математичного апарату для розв’язування відповідних нелінійних диференціальних рівнянь, які описують закони руху вказаних систем. Встановлено, що у випадку поздовжніх коливань рухомої балки при зростанні поздовжньої швидкості руху середовища до 10 м/с амплітуда коливання також зростає на 13,5 %. Однак, коли швидкість поздовжнього руху балки дорівнюватиме 5 м/с, то величина амплітуди зросте лише на 3 %. Встановлено, що при зростанні амплітуди різко зменшується частота поздовжніх коливань, а  якщо ж система буде рухатись з більшою швидкістю, наприклад, 20 м/с, то вона зменшує частоту коливання приблизно на 13 %. Отримані результати дозволяють оцінити вплив кінетичних та фізико-механічних параметрів на частоту та амплітуду коливань. Проведені дослідження за допомогою асимптотичного методу дозволяють  прогнозувати резонансні явища та отримати інженерні рішення для підвищення  ефективності  функціонування технологічного обладнанн

    Розроблення методу визначення стилю автора україномовних текстів на основі технологій лінгвометрії, стилеметрії та глоттохронології

    Get PDF
    We solved the problem of development of algorithmic software for processes of content monitoring for solving the problem of recognition of the style of an author of a Ukrainian text based on Web Mining and NLP technology. Decomposition of the method for recognition of the style of an author, based of analysis of the found stop words, was carried out. Specific features of the method include adaptation of morphological and syntactic analysis of lexical units to structural peculiarities of words/ texts in Ukrainian. It is syntactic words (stop words or anchor words) that are significant for an author’s individual style, as they are not related to the theme and content of the publication. Recognition of the author's style is based on analysis of coefficients of lexical author’s language: coherence of speech, lexical diversity, syntactic complexity indices of concentration and exclusivity for the author's fragment. They are used for subsequent comparison and determining of a degree of belonging of the analyzed text to a particular author. We studied internal "dynamics" of a text of randomly selected authors through analysis of coefficients of lexical author’s language for the first k, n and m (without the title) words of the author's fragment and the analyzed one. The obtained results were compared. We obtained results of experimental testing of the proposed method for content-monitoring for determining and analysis of stop words in Ukrainian scientific texts of technical area based on Web Mining technology. It was found that for the selected experimental base that contains 100 works, the method for analysis of an article without compulsory initial information and list of references attains the best results by density criterion. It is achieved through learning of the system and by checking specified blocked words and specified thematic vocabulary. Testing of the proposed method for determining of keywords from other categories of texts – of scientific humanitarian area, belles-lettres, journalistic, etc. – requires subsequent experimental research.Рассмотрены особенности применения технологий лингвометрии, стилеметрии и глоттохронологии для определения стиля автора публикаций. Лингвостатистический анализ авторского текста использует преимущества контент-мониторинга на основе методов NLP для определения стоповых слов. Квантитативный анализ стоповых слов использовано для определения степени принадлежности анализируемого текста конкретному автору. Предложен метод определения стиля автора украиноязычного текстаРозглянуто особливості застосування технологій лінгвометрії, стилеметрії та глоттохронології для визначення стилю автора публікацій. Лінгвостатистичний аналіз авторського тексту використовує переваги контент-моніторінгу на основі методів NLP для визначення стопових слів. Квантитативний аналіз стопових слів використано для визначення степеня приналежності аналізованого тексту конкретному авторові. Запропоновано метод визначення стилю автора україномовного текст

    Аналітичний метод дослідження математичної моделі хвильових процесів з двоточковими умовами за часом

    Get PDF
    Research and analysis of dynamic processes in oscillatory systems are closely connected to the establishment of exact or approximate analytical solutions to the problems of mathematical physics, which model such systems. The mathematical models of wave propagation in oscillatory systems under certain initial conditions at a fixed time are well known in the literature. However, wave processes in lengthy structures subject to an external force only and at the assigned states of the process at two points in time have been insufficiently studied. Such processes are modeled by a two-point time problem for the inhomogeneous wave equation in an unbounded domain t>0, x∈ℝs. The model takes into consideration the assignment of a linear combination with unknown amplitude of oscillations and the rate of its change at two points in time. A two-point problem, generally speaking, is the ill-posed boundary value problem, since the respective homogeneous problem has non-trivial solutions. A class of quasi-polynomials has been established as the class of the existence of a single solution to the problem. This class does not contain the non-trivial elements from the problem's kernel, which ensures the uniqueness of solution to the problem. We have proposed a precise method to build the solution in the specified class. The essence of the method is that the problem's solution is represented as the action of a differential expression, whose symbol is the right-hand side of the equation, on some function of parameters. The function is constructed in a special way using the equation and two-point conditions, and has special features associated with zeroes of the denominator – the characteristic determinant of the problem.The method is illustrated by the description of oscillatory processes within an infinite string and a membrane.The main practical application of the constructed method is the possibility to adequately mathematically model the oscillatory systems, which takes into consideration a possibility to control the system's parameters. Such a control over parameters makes it possible to perform optimal synthesis and design of parameters for the relevant technical systems in order to analyze and account for special features in the dynamic modes of oscillationsИсследования и анализ динамических процессов в колебательных системах тесно связаны с установлением точных или приближенных аналитических решений задач математической физики, которые моделируют такие системы. Математические модели распространения волн в колебательных системах при определенных начальных условий в фиксированный момент времени хорошо известны в литературе. Однако волновые процессы в длинномерных конструкциях при условии действия только внешней силы и заданных состояний процесса в два момента времени являются мало изученными. Такие процессы смоделированы двухточечной по времени задачей для неоднородного волнового уравнения в неограниченной области t>0, x∈ℝs. В модели учтены задания линейной комбинации неизвестной амплитуды колебаний и скорости ее изменения в два момента времени. Двухточечная задача, вообще говоря, является некорректнай краевой задачей, поскольку соответствующая однородная задача имеет нетривиальные решения. Установлен класс квазиполиномов как класс существования единственного решения задачи. Этот класс не содержит нетривиальных элементов ядра задачи, что обеспечивает единственность решения задачи. В указанном классе предложен точный метод построения решения. Суть метода заключается в том, что решение задачи изображается в виде действия дифференциального выражения, символом которого является правая часть уравнения, на некоторую функцию параметров. Функция специальным образом конструируется по уравнению и двухточечным условиям и имеет особенности, связанные с нулями знаменателя – характеристического определителя задачи.Метод проиллюстрирован для описания колебательных процессов бесконечной струны и мембраны.Главным практическим применением разработанного метода является возможность адекватного математического моделирования колебательных систем, которое учитывает возможность управления параметрами системы. Такое управление параметрами позволяет осуществлять оптимальный синтез и проектирование параметров соответствующих технических систем с целью анализа и учета особенностей динамических режимов колебанийДослідження та аналіз динамічних процесів у коливальних системах тісно зв’язані зі встановленням точних або наближених аналітичних розв’язків задач математичної фізики, які моделюють такі системи. Математичні моделі поширення хвиль у коливальних системах за певних початкових умов у фіксований момент часу є добре відомими в літературі. Однак хвильові процеси у довгомірних конструкціях за умови дії лише зовнішньої сили і заданих станів процесу у два моменти часу є мало вивченими. Такі процеси змодельовано двоточковою за часом задачею для неоднорідного хвильового рівняння в необмеженій області t>0, x∈ℝs. У моделі враховано задання лінійної комбінації невідомої амплітуди коливань та швидкості її зміни у два моменти часу. Двоточкова задача загалом є некоректною крайовою задачею, оскільки відповідна однорідна задача має нетривіальні розв’язки. Встановлено клас квазіполіномів як клас існування єдиного розв’язку задачі. Цей клас не містить нетривіальних елементів ядра задачі, що забезпечує єдиність розв’язку задачі. У вказаному класі запропоновано точний метод побудови розв’язку. Суть методу полягає в тому, що розв’язок задачі зображається у вигляді дії диференціального виразу, символом якого є права частина рівняння, на деяку функцію параметрів. Функція спеціальним чином конструююється за рівнянням та двоточковими умовами і має особливості, пов’язані з нулями знаменника – характеристичного визначника задачі.Метод проілюстровано для опису коливальних процесів нескінченної струни та мембрани.Головним практичним застосуванням розробленого методу є можливість адекватного математичного моделювання коливальних систем, яке враховує можливість керування параметрами системи. Таке керування параметрами дозволяє здійснювати оптимальний синтез та проектування параметрів відповідних технічних систем з метою аналізу та врахування особливостей динамічних режимів коливан

    Аналітичний метод дослідження математичної моделі хвильових процесів з двоточковими умовами за часом

    Get PDF
    Research and analysis of dynamic processes in oscillatory systems are closely connected to the establishment of exact or approximate analytical solutions to the problems of mathematical physics, which model such systems. The mathematical models of wave propagation in oscillatory systems under certain initial conditions at a fixed time are well known in the literature. However, wave processes in lengthy structures subject to an external force only and at the assigned states of the process at two points in time have been insufficiently studied. Such processes are modeled by a two-point time problem for the inhomogeneous wave equation in an unbounded domain t>0, x∈ℝs. The model takes into consideration the assignment of a linear combination with unknown amplitude of oscillations and the rate of its change at two points in time. A two-point problem, generally speaking, is the ill-posed boundary value problem, since the respective homogeneous problem has non-trivial solutions. A class of quasi-polynomials has been established as the class of the existence of a single solution to the problem. This class does not contain the non-trivial elements from the problem's kernel, which ensures the uniqueness of solution to the problem. We have proposed a precise method to build the solution in the specified class. The essence of the method is that the problem's solution is represented as the action of a differential expression, whose symbol is the right-hand side of the equation, on some function of parameters. The function is constructed in a special way using the equation and two-point conditions, and has special features associated with zeroes of the denominator – the characteristic determinant of the problem.The method is illustrated by the description of oscillatory processes within an infinite string and a membrane.The main practical application of the constructed method is the possibility to adequately mathematically model the oscillatory systems, which takes into consideration a possibility to control the system's parameters. Such a control over parameters makes it possible to perform optimal synthesis and design of parameters for the relevant technical systems in order to analyze and account for special features in the dynamic modes of oscillationsИсследования и анализ динамических процессов в колебательных системах тесно связаны с установлением точных или приближенных аналитических решений задач математической физики, которые моделируют такие системы. Математические модели распространения волн в колебательных системах при определенных начальных условий в фиксированный момент времени хорошо известны в литературе. Однако волновые процессы в длинномерных конструкциях при условии действия только внешней силы и заданных состояний процесса в два момента времени являются мало изученными. Такие процессы смоделированы двухточечной по времени задачей для неоднородного волнового уравнения в неограниченной области t>0, x∈ℝs. В модели учтены задания линейной комбинации неизвестной амплитуды колебаний и скорости ее изменения в два момента времени. Двухточечная задача, вообще говоря, является некорректнай краевой задачей, поскольку соответствующая однородная задача имеет нетривиальные решения. Установлен класс квазиполиномов как класс существования единственного решения задачи. Этот класс не содержит нетривиальных элементов ядра задачи, что обеспечивает единственность решения задачи. В указанном классе предложен точный метод построения решения. Суть метода заключается в том, что решение задачи изображается в виде действия дифференциального выражения, символом которого является правая часть уравнения, на некоторую функцию параметров. Функция специальным образом конструируется по уравнению и двухточечным условиям и имеет особенности, связанные с нулями знаменателя – характеристического определителя задачи.Метод проиллюстрирован для описания колебательных процессов бесконечной струны и мембраны.Главным практическим применением разработанного метода является возможность адекватного математического моделирования колебательных систем, которое учитывает возможность управления параметрами системы. Такое управление параметрами позволяет осуществлять оптимальный синтез и проектирование параметров соответствующих технических систем с целью анализа и учета особенностей динамических режимов колебанийДослідження та аналіз динамічних процесів у коливальних системах тісно зв’язані зі встановленням точних або наближених аналітичних розв’язків задач математичної фізики, які моделюють такі системи. Математичні моделі поширення хвиль у коливальних системах за певних початкових умов у фіксований момент часу є добре відомими в літературі. Однак хвильові процеси у довгомірних конструкціях за умови дії лише зовнішньої сили і заданих станів процесу у два моменти часу є мало вивченими. Такі процеси змодельовано двоточковою за часом задачею для неоднорідного хвильового рівняння в необмеженій області t>0, x∈ℝs. У моделі враховано задання лінійної комбінації невідомої амплітуди коливань та швидкості її зміни у два моменти часу. Двоточкова задача загалом є некоректною крайовою задачею, оскільки відповідна однорідна задача має нетривіальні розв’язки. Встановлено клас квазіполіномів як клас існування єдиного розв’язку задачі. Цей клас не містить нетривіальних елементів ядра задачі, що забезпечує єдиність розв’язку задачі. У вказаному класі запропоновано точний метод побудови розв’язку. Суть методу полягає в тому, що розв’язок задачі зображається у вигляді дії диференціального виразу, символом якого є права частина рівняння, на деяку функцію параметрів. Функція спеціальним чином конструююється за рівнянням та двоточковими умовами і має особливості, пов’язані з нулями знаменника – характеристичного визначника задачі.Метод проілюстровано для опису коливальних процесів нескінченної струни та мембрани.Головним практичним застосуванням розробленого методу є можливість адекватного математичного моделювання коливальних систем, яке враховує можливість керування параметрами системи. Таке керування параметрами дозволяє здійснювати оптимальний синтез та проектування параметрів відповідних технічних систем з метою аналізу та врахування особливостей динамічних режимів коливан

    Розроблення лінгвометричного методу автоматичного визначення автора текстового контенту на основі статистичного аналізу коефіцієнтів мовної різноманітності

    Get PDF
    We have developed the linguometric method for algorithmic support of content monitoring processes to solve the problem of the automatic identification of the author of the Ukrainian text content based on the technology of statistical analysis of the language diversity coefficients. The decomposition of the method for identification of the author based on the analysis of such speech factors as lexical diversity, degree (measure) of syntactic complexity, speech coherence, indexes of exclusivity and concentration of a text was performed. Such parameters of the author’s style as the number of words in the specified text, the total number of words in this text, the number of sentences, the number of prepositions, the number of conjunctions, the number of words with the frequency of 1, the number of words with the frequency of 10 and more were analyzed. The features of the developed methods are the adaptation of the morphological and syntactic analysis of lexical units to the peculiarities of the structures of Ukrainian words/texts. That is, when analyzing linguistic units of the word type, their belonging to a part of speech and declension within this part of speech was taken into account. For this, the flections of these words for their classification, separation of the base for the formation of the corresponding alphabetic-frequency dictionaries were analyzed. Filling these dictionaries was subsequently taken into consideration at the following stages of the identification of the authorship of a text, such as the calculation of parameters and coefficients of the author's speech. Syntactic words (stop or anchor) words are most essential for an individual style of an author, as they are not related to the subject and content of the publication. We compared the results in a set of 200 one-author papers in the technical area of more than 100 different authors over the period of 2001–2017 to determine if and how the coefficients of diversity of a text of these authors change within different periods of time. It was found that for the selected experimental base of more than 200 papers, the best results according to the density criterion are reached by the method for analysis of an article without the initial compulsory information, such as abstracts and keywords in different languages, as well as the list of literature.Разработано лингвометричний метод алгоритмического обеспечения процессов контент–мониторинга для решения задачи автоматического определения автора русскоязычного текстового контента на основе технологии статистического анализа коэффициентов языкового разнообразия. Проведения декомпозиции метода определения автора на основе анализа таких коэффициентов речи как лексическая разнообразие, степень (мера) синтаксической сложности, связность речи, индексы исключительности и концентрации текста. Проанализированы также параметры авторского стиля как количество слов в определенном тексте, общее количество слов этого текста, количество предложений, количество предлогов, количество союзов, количество слов с частотой 1, количество слов с частотой 10 и больше. Особенностями разработанного является адаптация морфологического и синтаксического анализа лексических единиц к особенностям конструкций украиноязычных слов / текстов. То есть при анализе лингвистических единиц типа слов, учитывалась их принадлежность к части речи и склонение в пределах этой части речи. Для этого проводился анализ флексий этих слов для их классификации, выделение основы для формирования соответствующих алфавитно–частотных словарей. Наполнение этих словарей в дальнейшем учитывались на следующих шагах определения авторства текста как расчет параметров и коэффициентов авторской речи. Для индивидуального стиля писателя показательны именно служебные (стоп или опорные) слова, поскольку они никак не связаны с темой и содержанием публикации. Проведено сравнение результатов на множестве 200 самостоятельных работ технического направления около 100 различных авторов период 2001–2017 гг. Для определения меняются и как коэффициенты разнообразия текста этих авторов в разные промежутки времени. Выявлено, что для выбранной экспериментальной базы из более 200 работ лучших результатов по критерию плотности достигает метод анализа статьи без начальной обязательной информации как аннотации и ключевые слова на разных языках, а также список литературыРозробленно лінгвометричний метод алгоритмічного забезпечення процесів контент-моніторінгу для розв’язання задачі автоматичного визначення автора україномовного текстового контенту на основі технології статистичного аналізу коефіцієнтів мовної різноманітності. Проведено декомпозицію методу визначення автора на основі аналізу таких коефіцієнтів мовлення як лексична різноманітність, ступінь (міра) синтаксичної складності, зв’язність мовлення, індекси винятковості та концентрації тексту. Проаналізовані також параметри авторського стилю як кількість слів у певному тексті, загальна кількість слів цього тексту, кількість речень, кількість прийменників, кількість сполучників, кількість слів із частотою 1, та кількість слів із частотою 10 та більше.Особливостями розробленого є адаптація морфологічного та синтаксичного аналізу лексичних одиниць до особливостей конструкцій україномовних слів/текстів. Тобто при аналізі лінгвістичних одиниць типу слів, враховувалась належність до частини мови та відмінювання в межах цієї частини мови. Для цього провадився аналіз флексій цих слів для класифікації, виділення основи для формування відповідних алфавітно-частотних словників. Наповнення цих словників в подальшому враховувалися на наступних кроках визначення авторства тексту як розрахунок параметрів та коефіцієнтів авторського мовлення. Для індивідуального стилю письменника показовими є саме службові (стопові або опорні) слова, оскільки вони ніяк не пов’язані з темою і змістом публікації.Проведено порівняння результатів на множині 200 одноосібних робіт технічного спрямування біля 100 різних авторів за період 2001–2017 рр. для визначення чи змінюються і як коефіцієнти різноманітності тексту цих авторів в різні проміжки часу. Виявлено, що для обраної експериментальної бази з понад 200 робіт найкращих результатів за критерієм щільності досягає метод аналізу статті без початкової обов’язкової інформації як анотації та ключові слова різними мовами, а також списку літератур

    Розроблення лінгвометричного методу автоматичного визначення автора текстового контенту на основі статистичного аналізу коефіцієнтів мовної різноманітності

    Get PDF
    We have developed the linguometric method for algorithmic support of content monitoring processes to solve the problem of the automatic identification of the author of the Ukrainian text content based on the technology of statistical analysis of the language diversity coefficients. The decomposition of the method for identification of the author based on the analysis of such speech factors as lexical diversity, degree (measure) of syntactic complexity, speech coherence, indexes of exclusivity and concentration of a text was performed. Such parameters of the author’s style as the number of words in the specified text, the total number of words in this text, the number of sentences, the number of prepositions, the number of conjunctions, the number of words with the frequency of 1, the number of words with the frequency of 10 and more were analyzed. The features of the developed methods are the adaptation of the morphological and syntactic analysis of lexical units to the peculiarities of the structures of Ukrainian words/texts. That is, when analyzing linguistic units of the word type, their belonging to a part of speech and declension within this part of speech was taken into account. For this, the flections of these words for their classification, separation of the base for the formation of the corresponding alphabetic-frequency dictionaries were analyzed. Filling these dictionaries was subsequently taken into consideration at the following stages of the identification of the authorship of a text, such as the calculation of parameters and coefficients of the author's speech. Syntactic words (stop or anchor) words are most essential for an individual style of an author, as they are not related to the subject and content of the publication. We compared the results in a set of 200 one-author papers in the technical area of more than 100 different authors over the period of 2001–2017 to determine if and how the coefficients of diversity of a text of these authors change within different periods of time. It was found that for the selected experimental base of more than 200 papers, the best results according to the density criterion are reached by the method for analysis of an article without the initial compulsory information, such as abstracts and keywords in different languages, as well as the list of literature.Разработано лингвометричний метод алгоритмического обеспечения процессов контент–мониторинга для решения задачи автоматического определения автора русскоязычного текстового контента на основе технологии статистического анализа коэффициентов языкового разнообразия. Проведения декомпозиции метода определения автора на основе анализа таких коэффициентов речи как лексическая разнообразие, степень (мера) синтаксической сложности, связность речи, индексы исключительности и концентрации текста. Проанализированы также параметры авторского стиля как количество слов в определенном тексте, общее количество слов этого текста, количество предложений, количество предлогов, количество союзов, количество слов с частотой 1, количество слов с частотой 10 и больше. Особенностями разработанного является адаптация морфологического и синтаксического анализа лексических единиц к особенностям конструкций украиноязычных слов / текстов. То есть при анализе лингвистических единиц типа слов, учитывалась их принадлежность к части речи и склонение в пределах этой части речи. Для этого проводился анализ флексий этих слов для их классификации, выделение основы для формирования соответствующих алфавитно–частотных словарей. Наполнение этих словарей в дальнейшем учитывались на следующих шагах определения авторства текста как расчет параметров и коэффициентов авторской речи. Для индивидуального стиля писателя показательны именно служебные (стоп или опорные) слова, поскольку они никак не связаны с темой и содержанием публикации. Проведено сравнение результатов на множестве 200 самостоятельных работ технического направления около 100 различных авторов период 2001–2017 гг. Для определения меняются и как коэффициенты разнообразия текста этих авторов в разные промежутки времени. Выявлено, что для выбранной экспериментальной базы из более 200 работ лучших результатов по критерию плотности достигает метод анализа статьи без начальной обязательной информации как аннотации и ключевые слова на разных языках, а также список литературыРозробленно лінгвометричний метод алгоритмічного забезпечення процесів контент-моніторінгу для розв’язання задачі автоматичного визначення автора україномовного текстового контенту на основі технології статистичного аналізу коефіцієнтів мовної різноманітності. Проведено декомпозицію методу визначення автора на основі аналізу таких коефіцієнтів мовлення як лексична різноманітність, ступінь (міра) синтаксичної складності, зв’язність мовлення, індекси винятковості та концентрації тексту. Проаналізовані також параметри авторського стилю як кількість слів у певному тексті, загальна кількість слів цього тексту, кількість речень, кількість прийменників, кількість сполучників, кількість слів із частотою 1, та кількість слів із частотою 10 та більше.Особливостями розробленого є адаптація морфологічного та синтаксичного аналізу лексичних одиниць до особливостей конструкцій україномовних слів/текстів. Тобто при аналізі лінгвістичних одиниць типу слів, враховувалась належність до частини мови та відмінювання в межах цієї частини мови. Для цього провадився аналіз флексій цих слів для класифікації, виділення основи для формування відповідних алфавітно-частотних словників. Наповнення цих словників в подальшому враховувалися на наступних кроках визначення авторства тексту як розрахунок параметрів та коефіцієнтів авторського мовлення. Для індивідуального стилю письменника показовими є саме службові (стопові або опорні) слова, оскільки вони ніяк не пов’язані з темою і змістом публікації.Проведено порівняння результатів на множині 200 одноосібних робіт технічного спрямування біля 100 різних авторів за період 2001–2017 рр. для визначення чи змінюються і як коефіцієнти різноманітності тексту цих авторів в різні проміжки часу. Виявлено, що для обраної експериментальної бази з понад 200 робіт найкращих результатів за критерієм щільності досягає метод аналізу статті без початкової обов’язкової інформації як анотації та ключові слова різними мовами, а також списку літератур

    Аналіз розробленого квантитативного методу автоматичного визначення автора україномовного текстового контенту науково-технічного спрямування

    Get PDF
    A formal approach was proposed to implement text content attribution. The study was conducted with Ukrainian scientific and technical texts. The results of application of the designed algorithms of automatic attribution of the text content based on the NLP and stylemetry methods were analyzed. Prospects and features of application of stylemetry information technologies for attribution of the text content were considered. Quantitative content analysis of scientific and technical text content takes advantage of content monitoring and text content analysis based on NLP, Web-Mining and stylemetry methods to identify the multitude of authors whose talking style is similar to that of the analyzed text fragment. This narrows the range of search for further use in the stylemetry methods to determine the degree of belonging of the analyzed text to a particular author.Decomposition of the attribution method was carried out based on analysis of such talking coefficients as lexical diversity, degree (measure) of syntactic complexity, talking coherence, indexes of exclusivity and concentration of the text. At the same time, author's style parameters such as the number of words in a certain text, the total number of words of this text, the number of sentences, the number of prepositions, the number of conjunctions, the number of words with occurrence frequency 1, the number of words with occurrence frequency 10 or more were analyzed. Further experimental study requires testing of the proposed method in identifying keywords of texts of other categories: scientific humanitarian, artistic, journalistic, etc.Предложен формальный подход реализации определения автора текста. Исследование проводилось в украиноязычных научных текстах технического профиля. Проанализированы результаты применения разработанных алгоритмов автоматического определения автора текстового контента на основе методов NLP и стилементрии. Рассмотрены перспективы и особенности применения информационных технологий стилеметрии для определения автора текстового контента. Квантитативных контент-анализ текстового контента научно-технического направления использует преимущества контент-мониторинга и контент-анализа текста на основе методов NLP, Web-Mining и стилеметрии для определения множества авторов, слыл вещание которых сходны с исследуемым фрагментом текста. Это сужает круг поиска при дальнейшем использовании в методах стилеметрии для определения степени принадлежности анализируемого текста конкретном автору.Проведена декомпозиция метода определения автора на основе анализа таких коэффициентов речи как лексическая разнообразие, степень (мера) синтаксической сложности, связность речи, индексы исключительности и концентрации текста. Параллельно проанализированы такие параметры авторского стиля как количество слов в определенном тексте, общее количество слов этого текста, количество предложений, количество предлогов, количество союзов, количество слов с частотой 1, количество слов с частотой 10 и больше. Дальнейшего экспериментального исследования требует апробация предложенного метода для определения ключевых слов из других категорий текстов – научных гуманитарного профиля, художественных, публицистических и др.Запропоновано формальний підхід реалізації визначення автора україномовного тексту. Дослідження проводилось в україномовних наукових текстах технічного профілю. Проаналізовані результати застосування розроблених алгоритмів автоматичного визначення автора текстового контенту на основі методів NLP та стилеметрії. Розглянуто перспективи та особливості застосування інформаційних технологій стилеметрії для визначення автора текстового контенту. Квантитативний контент-аналіз текстового контенту науково-технічного спрямування використовує переваги контент-моніторингу та контент-аналізу тексту на основі методів NLP, Web-Mining та стилеметрії для визначення множини авторів, стилі мовлення яких подібні з досліджуваним уривком тексту. Це звужує коло пошуку при подальшому використанні в методах стилеметрії для визначення ступеня приналежності аналізованого тексту конкретному авторові.Проведено декомпозицію методу визначення автора на основі аналізу таких коефіцієнтів мовлення як лексична різноманітність, ступінь (міра) синтаксичної складності, зв’язність мовлення, індекси винятковості та концентрації тексту. Паралельно проаналізовані такі параметри авторського стилю як кількість слів у певному тексті, загальна кількість слів цього тексту, кількість речень, кількість прийменників, кількість сполучників, кількість слів із частотою 1, та кількість слів із частотою 10 та більше. Подальшого експериментального дослідження потребує апробація запропонованого методу для визначення ключових слів з інших категорій текстів – наукових гуманітарного профілю, художніх, публіцистичних тощ

    Аналіз розробленого квантитативного методу автоматичного визначення автора україномовного текстового контенту науково-технічного спрямування

    Get PDF
    A formal approach was proposed to implement text content attribution. The study was conducted with Ukrainian scientific and technical texts. The results of application of the designed algorithms of automatic attribution of the text content based on the NLP and stylemetry methods were analyzed. Prospects and features of application of stylemetry information technologies for attribution of the text content were considered. Quantitative content analysis of scientific and technical text content takes advantage of content monitoring and text content analysis based on NLP, Web-Mining and stylemetry methods to identify the multitude of authors whose talking style is similar to that of the analyzed text fragment. This narrows the range of search for further use in the stylemetry methods to determine the degree of belonging of the analyzed text to a particular author.Decomposition of the attribution method was carried out based on analysis of such talking coefficients as lexical diversity, degree (measure) of syntactic complexity, talking coherence, indexes of exclusivity and concentration of the text. At the same time, author's style parameters such as the number of words in a certain text, the total number of words of this text, the number of sentences, the number of prepositions, the number of conjunctions, the number of words with occurrence frequency 1, the number of words with occurrence frequency 10 or more were analyzed. Further experimental study requires testing of the proposed method in identifying keywords of texts of other categories: scientific humanitarian, artistic, journalistic, etc.Предложен формальный подход реализации определения автора текста. Исследование проводилось в украиноязычных научных текстах технического профиля. Проанализированы результаты применения разработанных алгоритмов автоматического определения автора текстового контента на основе методов NLP и стилементрии. Рассмотрены перспективы и особенности применения информационных технологий стилеметрии для определения автора текстового контента. Квантитативных контент-анализ текстового контента научно-технического направления использует преимущества контент-мониторинга и контент-анализа текста на основе методов NLP, Web-Mining и стилеметрии для определения множества авторов, слыл вещание которых сходны с исследуемым фрагментом текста. Это сужает круг поиска при дальнейшем использовании в методах стилеметрии для определения степени принадлежности анализируемого текста конкретном автору.Проведена декомпозиция метода определения автора на основе анализа таких коэффициентов речи как лексическая разнообразие, степень (мера) синтаксической сложности, связность речи, индексы исключительности и концентрации текста. Параллельно проанализированы такие параметры авторского стиля как количество слов в определенном тексте, общее количество слов этого текста, количество предложений, количество предлогов, количество союзов, количество слов с частотой 1, количество слов с частотой 10 и больше. Дальнейшего экспериментального исследования требует апробация предложенного метода для определения ключевых слов из других категорий текстов – научных гуманитарного профиля, художественных, публицистических и др.Запропоновано формальний підхід реалізації визначення автора україномовного тексту. Дослідження проводилось в україномовних наукових текстах технічного профілю. Проаналізовані результати застосування розроблених алгоритмів автоматичного визначення автора текстового контенту на основі методів NLP та стилеметрії. Розглянуто перспективи та особливості застосування інформаційних технологій стилеметрії для визначення автора текстового контенту. Квантитативний контент-аналіз текстового контенту науково-технічного спрямування використовує переваги контент-моніторингу та контент-аналізу тексту на основі методів NLP, Web-Mining та стилеметрії для визначення множини авторів, стилі мовлення яких подібні з досліджуваним уривком тексту. Це звужує коло пошуку при подальшому використанні в методах стилеметрії для визначення ступеня приналежності аналізованого тексту конкретному авторові.Проведено декомпозицію методу визначення автора на основі аналізу таких коефіцієнтів мовлення як лексична різноманітність, ступінь (міра) синтаксичної складності, зв’язність мовлення, індекси винятковості та концентрації тексту. Паралельно проаналізовані такі параметри авторського стилю як кількість слів у певному тексті, загальна кількість слів цього тексту, кількість речень, кількість прийменників, кількість сполучників, кількість слів із частотою 1, та кількість слів із частотою 10 та більше. Подальшого експериментального дослідження потребує апробація запропонованого методу для визначення ключових слів з інших категорій текстів – наукових гуманітарного профілю, художніх, публіцистичних тощ
    corecore