\documentclass[10pt,a4paper]{article} % Packages \usepackage{fancyhdr} % For header and footer \usepackage{multicol} % Allows multicols in tables \usepackage{tabularx} % Intelligent column widths \usepackage{tabulary} % Used in header and footer \usepackage{hhline} % Border under tables \usepackage{graphicx} % For images \usepackage{xcolor} % For hex colours %\usepackage[utf8x]{inputenc} % For unicode character support \usepackage[T1]{fontenc} % Without this we get weird character replacements \usepackage{colortbl} % For coloured tables \usepackage{setspace} % For line height \usepackage{lastpage} % Needed for total page number \usepackage{seqsplit} % Splits long words. %\usepackage{opensans} % Can't make this work so far. Shame. Would be lovely. \usepackage[normalem]{ulem} % For underlining links % Most of the following are not required for the majority % of cheat sheets but are needed for some symbol support. \usepackage{amsmath} % Symbols \usepackage{MnSymbol} % Symbols \usepackage{wasysym} % Symbols %\usepackage[english,german,french,spanish,italian]{babel} % Languages % Document Info \author{ashel} \pdfinfo{ /Title (stylo-r-rus.pdf) /Creator (Cheatography) /Author (ashel) /Subject (stylo/R (rus) Cheat Sheet) } % Lengths and widths \addtolength{\textwidth}{6cm} \addtolength{\textheight}{-1cm} \addtolength{\hoffset}{-3cm} \addtolength{\voffset}{-2cm} \setlength{\tabcolsep}{0.2cm} % Space between columns \setlength{\headsep}{-12pt} % Reduce space between header and content \setlength{\headheight}{85pt} % If less, LaTeX automatically increases it \renewcommand{\footrulewidth}{0pt} % Remove footer line \renewcommand{\headrulewidth}{0pt} % Remove header line \renewcommand{\seqinsert}{\ifmmode\allowbreak\else\-\fi} % Hyphens in seqsplit % This two commands together give roughly % the right line height in the tables \renewcommand{\arraystretch}{1.3} \onehalfspacing % Commands \newcommand{\SetRowColor}[1]{\noalign{\gdef\RowColorName{#1}}\rowcolor{\RowColorName}} % Shortcut for row colour \newcommand{\mymulticolumn}[3]{\multicolumn{#1}{>{\columncolor{\RowColorName}}#2}{#3}} % For coloured multi-cols \newcolumntype{x}[1]{>{\raggedright}p{#1}} % New column types for ragged-right paragraph columns \newcommand{\tn}{\tabularnewline} % Required as custom column type in use % Font and Colours \definecolor{HeadBackground}{HTML}{333333} \definecolor{FootBackground}{HTML}{666666} \definecolor{TextColor}{HTML}{333333} \definecolor{DarkBackground}{HTML}{57878A} \definecolor{LightBackground}{HTML}{F4F7F7} \renewcommand{\familydefault}{\sfdefault} \color{TextColor} % Header and Footer \pagestyle{fancy} \fancyhead{} % Set header to blank \fancyfoot{} % Set footer to blank \fancyhead[L]{ \noindent \begin{multicols}{3} \begin{tabulary}{5.8cm}{C} \SetRowColor{DarkBackground} \vspace{-7pt} {\parbox{\dimexpr\textwidth-2\fboxsep\relax}{\noindent \hspace*{-6pt}\includegraphics[width=5.8cm]{/web/www.cheatography.com/public/images/cheatography_logo.pdf}} } \end{tabulary} \columnbreak \begin{tabulary}{11cm}{L} \vspace{-2pt}\large{\bf{\textcolor{DarkBackground}{\textrm{stylo/R (rus) Cheat Sheet}}}} \\ \normalsize{by \textcolor{DarkBackground}{ashel} via \textcolor{DarkBackground}{\uline{cheatography.com/123922/cs/23599/}}} \end{tabulary} \end{multicols}} \fancyfoot[L]{ \footnotesize \noindent \begin{multicols}{3} \begin{tabulary}{5.8cm}{LL} \SetRowColor{FootBackground} \mymulticolumn{2}{p{5.377cm}}{\bf\textcolor{white}{Cheatographer}} \\ \vspace{-2pt}ashel \\ \uline{cheatography.com/ashel} \\ \end{tabulary} \vfill \columnbreak \begin{tabulary}{5.8cm}{L} \SetRowColor{FootBackground} \mymulticolumn{1}{p{5.377cm}}{\bf\textcolor{white}{Cheat Sheet}} \\ \vspace{-2pt}Not Yet Published.\\ Updated 28th June, 2020.\\ Page {\thepage} of \pageref{LastPage}. \end{tabulary} \vfill \columnbreak \begin{tabulary}{5.8cm}{L} \SetRowColor{FootBackground} \mymulticolumn{1}{p{5.377cm}}{\bf\textcolor{white}{Sponsor}} \\ \SetRowColor{white} \vspace{-5pt} %\includegraphics[width=48px,height=48px]{dave.jpeg} Measure your website readability!\\ www.readability-score.com \end{tabulary} \end{multicols}} \begin{document} \raggedright \raggedcolumns % Set font size to small. Switch to any value % from this page to resize cheat sheet text: % www.emerson.emory.edu/services/latex/latex_169.html \footnotesize % Small font. \begin{multicols*}{2} \begin{tabularx}{8.4cm}{x{1.2 cm} x{6.8 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{Язык R - операторы}} \tn % Row 0 \SetRowColor{LightBackground} 2+2 & сумма \tn % Row Count 1 (+ 1) % Row 1 \SetRowColor{white} 5-3 & вычитание \tn % Row Count 2 (+ 1) % Row 2 \SetRowColor{LightBackground} 2*4 & умножение \tn % Row Count 3 (+ 1) % Row 3 \SetRowColor{white} 5/3 & деление \tn % Row Count 4 (+ 1) % Row 4 \SetRowColor{LightBackground} \seqsplit{(5-3)*2} & \seqsplit{последовательность} действий работает как ожидается \tn % Row Count 7 (+ 3) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{3.28 cm} x{4.72 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{Переменные}} \tn % Row 0 \SetRowColor{LightBackground} `x \textless{}- 2` & запись значения 2 в переменную {\bf{x}} \tn % Row Count 3 (+ 3) % Row 1 \SetRowColor{white} `x = 2` & то же самое \tn % Row Count 4 (+ 1) % Row 2 \SetRowColor{LightBackground} `x = \seqsplit{"переменная"`} & все в кавычках \seqsplit{интерпретируется} как \seqsplit{последовательность} символов (string) \tn % Row Count 10 (+ 6) % Row 3 \SetRowColor{white} `x=c(1,2,3)` & `c()` создает вектор \seqsplit{(упорядоченный} набор значений) \tn % Row Count 14 (+ 4) % Row 4 \SetRowColor{LightBackground} `x{[}1{]}` & `{[} {]}` \seqsplit{используются} для индексации переменных. `x{[}1{]}` достает первый элемент из вектора `x` \tn % Row Count 21 (+ 7) % Row 5 \SetRowColor{white} `x{[}1,1{]}` & двумерные объекты (матрицы, таблицы) \seqsplit{индексируются} через {[}индекс \seqsplit{строки.индекс} столбца{]} \tn % Row Count 28 (+ 7) % Row 6 \SetRowColor{LightBackground} `x\$column1` & данные столбцов в таблицах (data frame) можно получать по названию столбца через \$. В этом случае столбец \seqsplit{возвращается} как вектор значений. \$ также \seqsplit{используется}, чтобы \seqsplit{индексировать} любые названные переменные из сложных объектов (таблицы, листы, листы с листами и пр.) \tn % Row Count 49 (+ 21) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{3.44 cm} x{4.56 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{Функции}} \tn % Row 0 \SetRowColor{LightBackground} sum(1,2,3) & сумма \tn % Row Count 1 (+ 1) % Row 1 \SetRowColor{white} sqrt(16) & квадратный корень \tn % Row Count 3 (+ 2) % Row 2 \SetRowColor{LightBackground} c(1,2,3) & совмещение трех значений в вектор \tn % Row Count 6 (+ 3) % Row 3 \SetRowColor{white} paste("Hello","world",sep=" ") & совмещение нескольких текстов в одно значение \tn % Row Count 10 (+ 4) % Row 4 \SetRowColor{LightBackground} unique(c(1,1,2)) & функции в функциях. `unique()` возвращает только уникальные значения из вектора \tn % Row Count 17 (+ 7) \hhline{>{\arrayrulecolor{DarkBackground}}--} \SetRowColor{LightBackground} \mymulticolumn{2}{x{8.4cm}}{Общая структура функции: `function(x, arg1=0, arg2=TRUE)`. Где `x` - это вводные данные, а `arg1, arg2` - это аргументы, \seqsplit{контролирующие} поведение функции. Иногда ввод не требуется и задан \seqsplit{автоматически:} `stylo(gui=FALSE)`} \tn \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{1.44 cm} x{6.56 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{Язык R - рабочие директории}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{`getwd()`} & показывает путь к папке, которую R считает рабочей в данный момент \tn % Row Count 4 (+ 4) % Row 1 \SetRowColor{white} \seqsplit{`setwd()`} & \seqsplit{`setwd("path/to/folder")`} задает рабочую директорию по указанному пути \tn % Row Count 8 (+ 4) \hhline{>{\arrayrulecolor{DarkBackground}}--} \SetRowColor{LightBackground} \mymulticolumn{2}{x{8.4cm}}{Рабочая директория - это папка, которую работающий R использует для референции. Файлы с кодом и внешние файлы, которые будут нужны в работе лучше держать внутри рабочей директории, чтобы к ним легко было получить доступ. Новые файлы также сохраняются туда} \tn \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{8.4cm}}{\bf\textcolor{white}{RStudio}} \tn \SetRowColor{white} \mymulticolumn{1}{x{8.4cm}}{{\bf{File -\textgreater{} New Project}} создает новую папку с проектом, которую \seqsplit{автоматически} делает рабочей. \newline % Row Count 4 (+ 4) {\bf{File -\textgreater{} Open Project}} открывает существующий проект и переключает рабочую папку. \newline % Row Count 7 (+ 3) Рабочую папку можно изменить вручную из RStudio из панели {\bf{Files}}, которая находится снизу справа и используется для навигации по файловой системе (отображает файлы в рабочей папке по умолчанию). \seqsplit{Переместитесь} в нужную папку и нажмите {\bf{More -\textgreater{} Set As Working Directory}}% Row Count 17 (+ 10) } \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{2.64 cm} x{5.36 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{R - библиотеки}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{`install.packages()`} & \seqsplit{устанавливает} библиотеку из репозитория CRAN \tn % Row Count 4 (+ 4) % Row 1 \SetRowColor{white} library() & загружает библиотеку в память R \tn % Row Count 7 (+ 3) \hhline{>{\arrayrulecolor{DarkBackground}}--} \SetRowColor{LightBackground} \mymulticolumn{2}{x{8.4cm}}{\seqsplit{`install.packages("stylo")`} скачает и установит пакет stylo() на компьютер \newline \newline `library(stylo)` загрузит существующую библиотеку в память R и позволит работать с ее функциями.} \tn \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{1.76 cm} x{6.24 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{R - помощь}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{help(stylo)} & вызывает документацию \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} \seqsplit{?stylo()} & -{}-//-{}- \tn % Row Count 3 (+ 1) \hhline{>{\arrayrulecolor{DarkBackground}}--} \SetRowColor{LightBackground} \mymulticolumn{2}{x{8.4cm}}{Любая функция в R снабжена \seqsplit{документацией}.} \tn \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{x{2.64 cm} x{5.36 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{8.4cm}}{\bf\textcolor{white}{Пакет stylo}} \tn % Row 0 \SetRowColor{LightBackground} `stylo()` & дистанции \tn % Row Count 1 (+ 1) % Row 1 \SetRowColor{white} `classify()` & машинное обучение \tn % Row Count 3 (+ 2) % Row 2 \SetRowColor{LightBackground} \seqsplit{`rolling.classify()`} & МО скользящее по тексту \tn % Row Count 5 (+ 2) % Row 3 \SetRowColor{white} `oppose()` & ключевые слова \tn % Row Count 7 (+ 2) % Row 4 \SetRowColor{LightBackground} \seqsplit{`imposters()`} & верификация авторства \tn % Row Count 9 (+ 2) \hhline{>{\arrayrulecolor{DarkBackground}}--} \SetRowColor{LightBackground} \mymulticolumn{2}{x{8.4cm}}{Основные функции пакета {\bf{stylo}}} \tn \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{8.4cm}}{\bf\textcolor{white}{Функции и директории}} \tn \SetRowColor{white} \mymulticolumn{1}{x{8.4cm}}{{\bf{stylo()}} ищет тексты в папке {\bf{corpus}}, которая должна находиться в рабочей директории \newline % Row Count 3 (+ 3) {\bf{classify()}} ищет \seqsplit{тренировочный} корпус в папке {\bf{primary\_set}}, а проверочный в {\bf{secondary\_set}} \newline % Row Count 6 (+ 3) {\bf{rolling.classify()}} ищет \seqsplit{тренировочный} корпус в папке \newline % Row Count 8 (+ 2) {\bf{reference\_set}}, а текст для скользящей \seqsplit{классификации} - в {\bf{test\_set}} \newline % Row Count 11 (+ 3) {\bf{oppose()}} сравнивает тексты из двух папок {\bf{primary\_set}} и {\bf{secondary\_set}} \newline % Row Count 14 (+ 3) {\bf{imposters()}} работает напрямую с таблицами частот и поэтому требует отдельной подготовки данных% Row Count 18 (+ 4) } \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \SetRowColor{LightBackground} \mymulticolumn{1}{x{8.4cm}}{NB. {\bf{oppose()}} по умолчанию считает язык корпуса английским, поэтому эту функцию надо запускать с аргументом: \seqsplit{`oppose(corpus.lang="Other")`}} \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{8.4cm}}{\bf\textcolor{white}{Классы}} \tn \SetRowColor{white} \mymulticolumn{1}{x{8.4cm}}{Все функции в {\bf{stylo}} считывают классы {\bf{из названий файлов}}. Символы перед первой нижней чертой задают класс текста ({\emph{Dostoevsky\_1846.txt}} и {\emph{Dostoevsky\_1864.txt}}, будут отнесены к одному классу {\emph{Dostoevsky}}). \newline % Row Count 7 (+ 7) Классы нужны для цветового кодирования результатов (все тексты из класса Dostoevsky будут раскрашены одним цветом) и проверки результатов машинной \seqsplit{классификации}.% Row Count 13 (+ 6) } \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{8.4cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{8.4cm}}{\bf\textcolor{white}{Запуск функции "вручную"}} \tn \SetRowColor{LightBackground} \mymulticolumn{1}{x{8.4cm}}{stylo(gui = FALSE, \newline corpus.lang="Other", \newline analyzed.features = "c", \newline ngram.size = 4, \newline mfw.min=400, \newline mfw.max=400, \newline analysis.type = "CA")} \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} % That's all folks \end{multicols*} \end{document}